DeepSeek V3深夜低調升級,代碼進化令人震驚,網友實測可媲美Claude 3.5/3.7 Sonnet
昨夜,DeepSeek V3 毫無征兆地來了一波更新,升級到了「DeepSeek-V3-0324」版本。
目前,新版本在 Hugging Face 上可以下載并部署。
Hugging Face 地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/tree/main
不過,DeepSeek-V3-0324 沒有公布詳細的模型卡。我們只能看到它的參數為 6850 億以及張量類型。
此外,DeepSeek-V3-0324 支持了更寬松的 MIT 開源協議。
模型放出來后,DeepSeek-V3-0324 的代碼能力讓所有人震驚了!
有人表示,經過自己的測試,DeepSeek-V3-0324 在數學推理和前端開發方面的表現優于 Claude 3.5 和 Claude 3.7 Sonnet。
圖源:https://x.com/selcukemiravci/status/1904311856313028870
X 博主「@KuittinenPetri」表示,Anthropic 和 OpenAI 陷入了困境。更新后的 DeepSeek-V3-0324 可以輕松免費地創建漂亮的 HTML5、CSS 和前端。
圖源:https://x.com/KuittinenPetri/status/1904224441384771909
提示詞如下:為 AI 公司「NexusAI」創建一個外觀精美的響應式首頁,將所有內容包含在一個 HTML5 文件中。結果如下圖所示,所有圖像,包括用戶故事和他們的面孔,一切都是用這個提示完成的。
他認為:DeepSeek-V3-0324 是 DeepSeek 最好的非推理模型,通常更適合創意寫作任務,但現在也比 R1 更適合制作 HTML5 + CSS + 前端。上述提示的結果代碼總共 958 行,但它實際上實現了一個交互式網站,包括所有圖像。并且結果也適用于移動設備。
他還稱,DeepSeek-V3-0324 在編寫代碼方面確實很棒!早期測試顯示,它是所有開源選擇中最好的非推理模型,甚至可以與 Claude 3.5/3.7 Sonnet 相媲美。
另一位網友也讓 DeepSeek-V3-0324 創建網站,只見該模型一口氣寫了 800 多行代碼,中途一次都沒卡殼,生成的網站布局也非常完美。
這位網友還把提示語放出來了,簡單的幾行字,大家可以前去一試。
Hyperbolic 聯合創始人兼 CTO Yuchen 稱自己的氛圍測試顯示,DeepSeek- V3-0324 已經有了一些思維鏈模型的影子。
他測試了題目「strawberry 中有多少個 r」,可以看到,DeepSeek-V3-0324 展示了詳細的推理步驟。他表示,真正的「Open AI」又贏了。
圖源:https://x.com/Yuchenj_UW/status/1904223627509465116
還有人將 DeepSeek-V3-0324 與 OpenAI o1-pro 生成小球的效果進行了比較。下面是 o1-pro 的效果:
他表示,DeepSeek-V3-0324 大約可以實現 o1-pro70% 的性能,但它免費并且 API 價格比后者便宜了至少 50 倍。二者選誰一目了然!
圖源:https://x.com/michaelkaoi/status/1904178015833297342
X 博主「orange.ai」對 DeepSeek V3、DeepSeek-V3-0324 與 Claude Sonnet 3.7 的海報設計結果進行了比較,同樣表示前端代碼能力相比上代有了顯著增強。
圖源:https://x.com/oran_ge/status/1904306405823467526