出品 | 51CTO技術棧(微信號:blog51cto)
剛剛,DeepSeek放出了更新模型的官方報告,并發推文:
?? DeepSeek-V3-0324 現已推出!
??推理能力大幅提升
??更強的前端開發技能
??更智能的工具使用能力
?對于非復雜推理任務,我們建議使用 V3 — 只需關閉“DeepThink”
?? API 使用保持不變
??模型現在根據 MIT 許可證發布,就像 DeepSeek-R1 一樣!
報告細節已經可以在HF上進行查看:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
??模型參數:685B
?更新版V3的幾項改進:
1.推理能力
基準測試表現顯著提升
2.前端 Web 開發
- 提高代碼的可執行性
- 生成更美觀的網頁和游戲前端
3.中文寫作能力 風格和內容質量提升
- 符合 R1 寫作風格
- 中長篇寫作質量更優
4.功能增強
- 多輪交互改寫能力提升
- 翻譯質量和書信寫作優化
5.中文搜索能力
- 報告分析請求的輸出更加詳細
6.函數調用改進
- 函數調用準確率提升,修復了 V3 版本中的相關問題
在推文下,海外網友紛紛在評論區“催更”DeepSeek-R2!
相信不久的將來,DeepSeek就會給我們想要的驚喜吧!