یک سال پس از تغییرات قابل توجه در بازار هوش مصنوعی، دیپسیک با معرفی دو مدل جدید به عرصه رقابت بازگشت. این مدلها، که به نامهای DeepSeek V3.2 و V3.2-Speciale شناخته میشوند، به ادعای شرکت میتوانند با سیستمهای پیشرفتهای مانند GPT-5 و جمنای ۳ پرو رقابت کنند یا حتی از آنها بهتر عمل کنند.
دیپسیک در حالی که رقبای آمریکایی به سمت استفاده از خوشههای بزرگ تراشههای پیشرفته رفتهاند، بر بهینهسازی و بهرهوری تمرکز کرده است. این شرکت اعلام کرده که روش آموزشی بهینهسازی شدهاش میتواند هوش همسطح مدلهای بزرگ را با استفاده از سختافزارهای در دسترستر ارائه دهد.
مدل استاندارد V3.2 بهطور پیشفرض قابلیت استدلال مبتنی بر ابزار را دارد و نیازی به فعالسازی جداگانه ندارد. اما تمرکز اصلی بر روی نسخه V3.2-Speciale است که دیپسیک ادعا میکند در ارزیابیهای داخلی از GPT-5 پیشی گرفته و در وظایف سنگین استدلالی همسطح جمنای ۳ پرو قرار دارد. این شرکت به عملکرد این مدل در المپیادهای جهانی ریاضی و انفورماتیک اشاره کرده و خروجیهای نهایی را برای بررسی عمومی منتشر کرده است.
دیپسیک موفقیتهای خود را ناشی از دو نوآوری میداند: یک سازوکار Sparse-Attention برای پردازش کارآمد متنهای طولانی و یک مسیر توسعهیافته یادگیری تقویتی که بر روی بیش از ۸۵ هزار وظیفه چندمرحلهای آموزش دیده است. مدل V3.2 هماکنون از طریق وبسایت، اپلیکیشن موبایل و API در دسترس است، در حالی که نسخه آزمایشی V3.2-Speciale تنها از طریق یک API موقت ارائه میشود که پس از ۱۵ دسامبر ۲۰۲۵ حذف خواهد شد.
با وجود ادعاهای قابل توجه، ارزیابیهای مستقل نشان خواهد داد که این مدلها در عمل چه جایگاهی نسبت به رقبای آمریکایی دارند. اما واضح است که دیپسیک مصمم است ثابت کند برای دستیابی به هوش مصنوعی سطح بالا، نیازی به هزینههای کلان نیست.
نظر شما در مورد این مطلب چیه؟