أطلقت DeepSeek نموذج V3.1: تحقيق وضع الاستدلال المختلط وتعزيز وظائف واجهة برمجة التطبيقات

【链文】PANews 21 أغسطس، أعلنت DeepSeek عن إطلاق نموذج V3.1، حيث تحقق لأول مرة وضع "Think & Non-Think" للذكاء الاصطناعي المختلط، يمكن للمستخدمين التبديل من خلال زر "DeepThink". سرعة استنتاج وضع V3.1-Think قد تحسنت مقارنة بنموذج DeepSeek-R1-0528، كما تم تعزيز القدرة على استخدام الأدوات والمهام المعقدة متعددة الخطوات. تمت إضافة دعم سياق 128K إلى واجهة برمجة التطبيقات، مما يجعلها متوافقة مع تنسيق واجهة برمجة التطبيقات من Anthropic واستدعاءات الدوال الصارمة. نموذج V3.1 الأساسي يعتمد على 840B token لتمديد السياقات الطويلة، وقد تم رفع الوزن مفتوح المصدر، وسيتم تعديل الأسعار في 5 سبتمبر.

DEEPSEEK23.15%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 5
  • إعادة النشر
  • مشاركة
تعليق
0/400
Ser_This_Is_A_Casinovip
· منذ 25 د
128 كيلو رهيبة أول ج في الكون
شاهد النسخة الأصليةرد0
ZenChainWalkervip
· 08-22 00:02
أداة مثبتة، سيتعين علينا المنافسة مرة أخرى
شاهد النسخة الأصليةرد0
LiquidityHuntervip
· 08-21 07:11
128k السياقة لا بأس بها، لكن مشكلة السيولة لم تُحل بعد.
شاهد النسخة الأصليةرد0
MEVSandwichMakervip
· 08-21 07:10
هل يجب على الذكاء الاصطناعي التفكير؟
شاهد النسخة الأصليةرد0
SelfCustodyIssuesvip
· 08-21 07:06
شخص مختل آخر
شاهد النسخة الأصليةرد0
  • تثبيت