深夜重磅!DeepSeek升級版來了!671B推理怪獸Prover-V2炸場開源
就在大家準備開啟假期模式時,DeepSeek 果然又祭出了祖傳的假日突襲技能,這次不是網傳的R2,而是推理核彈級模型——DeepSeek-Prover-V2-671B。
核心參數:
? 671B參數巨無霸,MoE架構火力全開
? 每層都是MoE!256專家陣列+共享專家
? 單token激活8專家,中間層2048寬
? 逆天163k上下文窗口,直接改寫長文檔認知邊界
升級版剛上線HuggingFace,就狂攬100+星,技術宅們怕不是已經組隊開始壓力測試了。
所以問題來了:
- 這次"假期特別版"會不會又藏著什么數學推理黑科技?
- 之前Prover系列的邏輯證明能力會有多大飛躍?
- 繼128k之后直接翻倍到163k,文檔理解要革命?
贊
收藏
回復
分享
微博
QQ
微信
舉報

回復
相關推薦