小米殺入推理大模型賽道!MiMo-7B以小搏大,數學代碼雙殺32B參數巨頭
昨天科技圈被小米的一條重磅消息刷屏了——全球首個專為推理設計的大型開源模型 Xiaomi MiMo 正式亮相!更令人震驚的是,這個僅 70億參數 的小模型,在數學推理(AIME24-25)和代碼競賽(LiveCodeBench v5)測評中,直接碾壓了OpenAI閉源的 o1-mini 和阿里開源的 QwQ-32B-Preview。
在DeepSeek-R1掀起強化學習(RL)熱潮的當下,小米用MiMo-7B交出了一份驚艷答卷:
數學推理:AIME24-25測試中,MiMo解題準確率遠超同賽道選手,甚至能處理復雜微積分和幾何證明;代碼能力:LiveCodeBench v5競賽級題目中,它生成的代碼邏輯嚴謹,調試效率直逼人類工程師:
能以小模型搏大場面,背后是小米AI團隊的兩板斧:
在預訓練階段,小米合成了海量數學論文、編程題庫和邏輯謎題,通過三階段漸進式訓練(從簡單到復雜),讓模型啃透25T tokens的“推理硬菜”。而在后訓練階段,則通過強化學習優化效果:
小米這次不玩“閉源炫技”,而是直接把MiMo全系列模型扔上了HuggingFace(鏈接見文末),開發者可免費商用。
小米的野心:AGI長征才剛開始
盡管MiMo-7B已展現驚人潛力,但小米清醒地表示:2025年只是大模型下半場的起點,AGI之路道阻且長。不過,從手機到汽車再到AI,這家公司正用實際行動證明——中國科技企業,完全能在基礎模型層面與全球巨頭掰手腕。
贊
收藏
回復
分享
微博
QQ
微信
舉報

回復
相關推薦