یک آزمایشگاه هوش مصنوعی چینی، DeepSeek، مدل استدلالی به نام «DeepSeek-R1-Lite-Preview» را منتشر کرده است که با مدل های پیشرفته OpenAI o1 رقابت میکند. در فضای منبع باز، برای اولین بار است که میبینیم که یک مدل هوش مصنوعی پارادایم جدید OpenAI را با مدل های استدلال o1 تکرار میکند.
درست مانند مکانیسم “تفکر” OpenAI o1، مدل DeepSeek دارای گزینه “Deep Think” است که به آن اجازه میدهد تا قبل از دادن پاسخ نهایی، پاسخ خود را دوباره ارزیابی کند. بهترین بخش این است که DeepSeek-R1-Lite-Preview زنجیره خام فکری را نشان میدهد که در مدل های o1 OpenAI وجود ندارد.
ناگفته نماند، DeepSeek قصد دارد مدل استدلال خود را منبع باز کند و مقالهای را منتشر کند که جزئیات نحوه پیاده سازی موتور استدلال را شرح دهد. ممکن است دریچههای محاسبات زمان آزمایشی یا مقیاسبندی استنتاج در فضای منبع باز را باز کند.
جدا از آن، DeepSeek همچنین بنچمارک هایی منتشر کرده است که نشان میدهد مدل DeepSeek-R1-Lite-Preview آن بهتر از مدل O1-preview OpenAI است. در معیارهایی مانند AIME 2024، MATH و Codeforces، مدل DeepSeek-R1-Lite-Preview بهتر از مدل o1-preview عمل میکند. در آزمایشهای دیگر، بسیار نزدیک به شکست دادن مدل پرچمدار OpenAI است.
مقایسه بین مدل deepseek و openai o1
بر اساس گزارش فایننشال تایمز، در صورتی که اطلاع ندارید، DeepSeek توسط High-Flyer، یک صندوق Quant مستقر در چین، پشتیبانی میشود که به یک پیشگام هوش مصنوعی تبدیل شده است. در دانوتک، مدل جدید DeepSeek را تست کردیم و واقعاً ما را شگفت زده کرد. در استدلال بسیار سریع است و بسیاری از مسائل از جمله معماهای پیچیده و غیره را حل میکند.
مدل DeepSeek-R1-Lite-Preview به یکی از جایگزین های امیدوارکننده برای ChatGPT تبدیل شده است. این به صورت رایگان در دسترس است و کاربران میتوانند مدل را در chat.deepseek.com بررسی کنند. کاربران روزانه 50 پیام رایگان دریافت میکنند، اما از آنجایی که این یک مدل چینی است، در برخی موضوعات بحث برانگیز سانسور میشود.