【链文】PANews 21 tháng 8, thông tin, DeepSeek công bố ra mắt mô hình V3.1, lần đầu tiên thực hiện chế độ suy diễn hỗn hợp "Think & Non-Think", người dùng có thể chuyển đổi thông qua nút "DeepThink". Tốc độ suy diễn của chế độ V3.1-Think được cải thiện so với DeepSeek-R1-0528, và nâng cao khả năng sử dụng công cụ và thực hiện nhiệm vụ đại lý nhiều bước. API mới bổ sung hỗ trợ ngữ cảnh 128K, tương thích với định dạng API Anthropic và gọi hàm nghiêm ngặt. Mô hình cơ bản V3.1 dựa trên 840B token mở rộng ngữ cảnh dài, trọng số mã nguồn mở đã được phát hành, giá sẽ được điều chỉnh vào ngày 5 tháng 9.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
12 thích
Phần thưởng
12
4
Đăng lại
Chia sẻ
Bình luận
0/400
ZenChainWalker
· 15giờ trước
Thực sự là đè nén, lại sắp phải cạnh tranh nội bộ rồi.
Xem bản gốcTrả lời0
LiquidityHunter
· 08-21 07:11
128k ngữ cảnh thì cũng ổn, nhưng vấn đề thanh khoản vẫn chưa được giải quyết.
DeepSeek ra mắt mô hình V3.1: Thực hiện chế độ suy diễn hỗn hợp Tăng cường chức năng API
【链文】PANews 21 tháng 8, thông tin, DeepSeek công bố ra mắt mô hình V3.1, lần đầu tiên thực hiện chế độ suy diễn hỗn hợp "Think & Non-Think", người dùng có thể chuyển đổi thông qua nút "DeepThink". Tốc độ suy diễn của chế độ V3.1-Think được cải thiện so với DeepSeek-R1-0528, và nâng cao khả năng sử dụng công cụ và thực hiện nhiệm vụ đại lý nhiều bước. API mới bổ sung hỗ trợ ngữ cảnh 128K, tương thích với định dạng API Anthropic và gọi hàm nghiêm ngặt. Mô hình cơ bản V3.1 dựa trên 840B token mở rộng ngữ cảnh dài, trọng số mã nguồn mở đã được phát hành, giá sẽ được điều chỉnh vào ngày 5 tháng 9.