【链文】PANews 21 أغسطس، أعلنت DeepSeek عن إطلاق نموذج V3.1، حيث تحقق لأول مرة وضع "Think & Non-Think" للذكاء الاصطناعي المختلط، يمكن للمستخدمين التبديل من خلال زر "DeepThink". سرعة استنتاج وضع V3.1-Think قد تحسنت مقارنة بنموذج DeepSeek-R1-0528، كما تم تعزيز القدرة على استخدام الأدوات والمهام المعقدة متعددة الخطوات. تمت إضافة دعم سياق 128K إلى واجهة برمجة التطبيقات، مما يجعلها متوافقة مع تنسيق واجهة برمجة التطبيقات من Anthropic واستدعاءات الدوال الصارمة. نموذج V3.1 الأساسي يعتمد على 840B token لتمديد السياقات الطويلة، وقد تم رفع الوزن مفتوح المصدر، وسيتم تعديل الأسعار في 5 سبتمبر.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 16
أعجبني
16
5
إعادة النشر
مشاركة
تعليق
0/400
Ser_This_Is_A_Casino
· منذ 25 د
128 كيلو رهيبة أول ج في الكون
شاهد النسخة الأصليةرد0
ZenChainWalker
· 08-22 00:02
أداة مثبتة، سيتعين علينا المنافسة مرة أخرى
شاهد النسخة الأصليةرد0
LiquidityHunter
· 08-21 07:11
128k السياقة لا بأس بها، لكن مشكلة السيولة لم تُحل بعد.
أطلقت DeepSeek نموذج V3.1: تحقيق وضع الاستدلال المختلط وتعزيز وظائف واجهة برمجة التطبيقات
【链文】PANews 21 أغسطس، أعلنت DeepSeek عن إطلاق نموذج V3.1، حيث تحقق لأول مرة وضع "Think & Non-Think" للذكاء الاصطناعي المختلط، يمكن للمستخدمين التبديل من خلال زر "DeepThink". سرعة استنتاج وضع V3.1-Think قد تحسنت مقارنة بنموذج DeepSeek-R1-0528، كما تم تعزيز القدرة على استخدام الأدوات والمهام المعقدة متعددة الخطوات. تمت إضافة دعم سياق 128K إلى واجهة برمجة التطبيقات، مما يجعلها متوافقة مع تنسيق واجهة برمجة التطبيقات من Anthropic واستدعاءات الدوال الصارمة. نموذج V3.1 الأساسي يعتمد على 840B token لتمديد السياقات الطويلة، وقد تم رفع الوزن مفتوح المصدر، وسيتم تعديل الأسعار في 5 سبتمبر.