昨天晚上,“DeepSeek R2提前泄露”的傳言刷屏 AI 圈,原因盡然來自Hugging Face CEO 在推特的一條帖子,引發全網猜測。
帖子表達的信息有些晦澀:三個眼睛表情,配上了DeepSeek 在 Hugging Face 的倉庫鏈接(https://huggingface.co/deepseek-ai)以及相關配圖。
網友難免會聯想猜測:也許DeepSeek R2 即將上線發布。
緊接著就是各種有關DeepSeekR2的離譜謠言:
一位X用戶“預告”:
“Deepseek-R2 明天或周三發布,在大多數基準測試中比 o3 稍差,但便宜 97%,幻覺更少。”
當然最多瘋傳的則是未經證實的“參數和細節”——
(1)擁有 1.2 萬億參數,活躍參數為 780 億,采用混合 MoE 架構
(2)成本比 GPT-4o 便宜 97.3%(輸入每百萬次 0.07 美元,輸出每百萬次 0.27 美元)
(3)使用了 5.2PB 的訓練數據,在 C-Eval2.0 測試中取得了 89.7% 的得分
(4)視覺能力更強,在 COCO 測試集上達到了 92.4%
(5)某國產芯片910B利用率達82%
(6)大規模轉移,遠離美國供應鏈
傳的煞有其事,不過據小編看到業內人士對此事的反應:從瘋傳的部分圖片來源看,是一個炒股網站。
所以,DeepSeek又被某些人“薅羊毛”了。可以肯定這些參數肯定是謠言。
另外,X上已經有別有用心的用戶注冊了DeepSeek R2的昵稱,大家注意防詐。
不過大家對于R2的發布充滿了期待,小編上周在做直播欄目時,嘉賓表示對于多模態推理方面很有期待,希望 R2 能給出更多的意外之喜。
截至發稿時,DeepSeek 和 Qwen 官方均未對相關傳聞作出回應。