2小時登頂全球最強開源模型!Qwen3力壓DeepSeek-R1和OpenAI o1,登頂開源王座!
最近,阿里Qwen3 正式開源,兩小時就狂攬17k星,直接登頂全球最強開源模型,暴擊DeepSeek-R1和OpenAI o1,中國AI的牌面支棱起來了!
這次開源的Qwen3主要有以下核心亮點:
1?? 混合推理模式:首創(chuàng)非思考模式+慢思考雙模式:對于追求速度的問題,可使用非思考模式實現秒速回應,遇到復雜任務則轉為慢思考模式,進行深度推演;
2?? 低成本高性能:Qwen3采用36萬億token預訓練。并且在數學能力方面,Qwen3在AIME25 中獲得81.5分;代碼能力同樣很強:在LiveCodeBench中以 70+分全面碾壓其他大模型。
性能大幅提升的同時,Qwen3 的部署成本還大幅下降,僅需 4 張 H20 即可部署滿血版,顯存占用僅為性能相近模型的三分之一,在手機端也能絲滑運行;
3?? 支持多種語言:Qwen3支持119種語言,就連方言也不在話下。
有網友甚至調侃:“Meta LlamaCon還沒開,風頭就被阿里截胡了。”
這波就像開源界的《流浪地球》,中國技術再次以實力輸出全球。
只能說,OpenAI和DeepSeek的板凳該坐熱了…
贊
收藏
回復
分享
微博
QQ
微信
舉報

回復
相關推薦