成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

新“SOTA”推理模型避戰(zhàn)Qwen和R1？歐版OpenAI被噴麻了

2025-06-11 14:28:34

在官方展示的基準(zhǔn)測(cè)試結(jié)果中，DeepSeek-R1的數(shù)據(jù)確實(shí)不是最新的（在AIME-25數(shù)學(xué)測(cè)試中，DeepSeek-R1-0528的準(zhǔn)確率已經(jīng)從舊版的70%提升至87.5%），并且比較行列里完全不見Qwen的身影。

“歐洲的OpenAI”Mistral AI終于發(fā)布了首款推理模型——Magistral。

然而再一次遭到網(wǎng)友質(zhì)疑：怎么又不跟最新版Qwen和DeepSeek R1 0528對(duì)比？

（此前該公司發(fā)布Ministral 3B/8B時(shí)，聲稱“始終優(yōu)于同行”，卻沒有對(duì)比Qwen2.5）

圖片

圖片

在該模型發(fā)布的前幾個(gè)小時(shí)，Mistral AI的CEO Arthur Mensch在接受爐邊訪談時(shí)聲稱即將發(fā)布的Magistral能夠與其他所有競(jìng)爭(zhēng)對(duì)手相抗衡。

在官方展示的基準(zhǔn)測(cè)試結(jié)果中，DeepSeek-R1的數(shù)據(jù)確實(shí)不是最新的（在AIME-25數(shù)學(xué)測(cè)試中，DeepSeek-R1-0528的準(zhǔn)確率已經(jīng)從舊版的70%提升至87.5%），并且比較行列里完全不見Qwen的身影。

圖片

不過，與同公司初期模型Mistral Medium 3相比，該框架在AIME-24上的準(zhǔn)確率提升了50%。

此次Magistral發(fā)布了兩種版本：

Magistral Small——24B參數(shù)的開源權(quán)重版本，可在Apache 2.0許可下自行部署。

Magistral Medium——更強(qiáng)大的、面向企業(yè)的版本，在Amazon SageMaker上提供。

圖片

專為透明推理而設(shè)計(jì)

在Magistral發(fā)布之前，Mistral AI的CEO Arthur Mensch在訪談中提到：

“從歷史上看，我們看到美國(guó)的模型用英語(yǔ)進(jìn)行推理，中國(guó)的模型更擅長(zhǎng)用中文進(jìn)行推理。”

于是，這次Magistral的一個(gè)亮點(diǎn)就是支持多語(yǔ)言推理，尤其是解決了主流模型用歐洲語(yǔ)言的推理效果不如本土語(yǔ)言的缺陷。

下面的例子展示了在Le Chat中，使用Magistral Medium的阿拉伯語(yǔ)提示和響應(yīng)。

圖片

與通用模型不同的是，Magistral針對(duì)多步邏輯進(jìn)行了微調(diào)，提升了可解釋性，并在用戶的語(yǔ)言中提供了可追溯的思考過程，能夠?qū)崿F(xiàn)大規(guī)模實(shí)時(shí)推理。

下面的例子展示了重力、摩擦和碰撞的單次物理模擬，在預(yù)覽中使用的是Magistral Medium。

圖片

就好像Magistral不是黑箱預(yù)言家，而是一個(gè)能陪你「擺事實(shí)、講道理」的智能伙伴。

并且，在Le Chat中，通過Flash Answers，Magistral Medium的token吞吐量比大多數(shù)競(jìng)爭(zhēng)對(duì)手快10倍。

這就能夠?qū)崿F(xiàn)大規(guī)模的實(shí)時(shí)推理和用戶反饋。

圖片

作為Mistral推出的首個(gè)基于純強(qiáng)化學(xué)習(xí)（RL）訓(xùn)練的推理大模型，Magistral采用改進(jìn)的Group Relative Policy Optimization（GRPO）算法。

直接通過RL訓(xùn)練，不依賴任何現(xiàn)有推理模型的蒸餾數(shù)據(jù)（如DeepSeek-R1需SFT預(yù)熱）。

通過消除KL散度懲罰、動(dòng)態(tài)調(diào)整探索閾值和基于組歸一化的優(yōu)勢(shì)計(jì)算，在AIME-24數(shù)學(xué)基準(zhǔn)上實(shí)現(xiàn)從26.8%到73.6%的準(zhǔn)確率躍升。

圖片

首創(chuàng)異步分布式訓(xùn)練架構(gòu)，通過Generators持續(xù)生成、Trainers異步更新的設(shè)計(jì)，配合動(dòng)態(tài)批處理優(yōu)化，實(shí)現(xiàn)高效的大規(guī)模RL訓(xùn)練。

還反直覺地發(fā)現(xiàn)純文本RL訓(xùn)練可提升多模態(tài)性能（如MMMU-Pro-Vision提升12%），并驗(yàn)證RL對(duì)小模型同樣有效（24B的Magistral Small在AIME-24準(zhǔn)確率達(dá)70.7%）。

圖片

這些創(chuàng)新使Magistral在無需預(yù)訓(xùn)練蒸餾的情況下，以純RL方式為L(zhǎng)LM的強(qiáng)化學(xué)習(xí)訓(xùn)練提供了新范式。

One More Thing

官方?jīng)]有給出Magistral與最新版Qwen和R1的對(duì)比，網(wǎng)友來代勞了。

圖片

從結(jié)果可以看出，Qwen 4B與該模型相近，小型的30B MoE效果更好，R1最新版就更不用說了（doge）。

并且，由于“歐洲的OpenAI”越來越不Open，Stability AI前CEO建議Mistral AI應(yīng)該爭(zhēng)取真正的開源來占據(jù)開源的領(lǐng)導(dǎo)地位。

圖片

參考鏈接：

[1]https://mistral.ai/news/magistral

[2]https://x.com/dylan522p/status/1932563462963507589

[3]https://x.com/arthurmensch/status/1932451932406415531

責(zé)任編輯：武曉燕來源：量子位

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

主站蜘蛛池模板：亚洲高清视频一区二区 | 亚州精品天堂中文字幕 | 日韩av一区二区在线观看 | 国产精品久久久久久久久大全 | 99re在线视频观看 | 亚洲免费一区 | 日韩在线观看中文字幕 | 日韩高清av| 国产乱性 | 99精品视频在线 | 国内久久| 99精品欧美一区二区三区综合在线 | 亚洲一区中文字幕 | 国产精品伦一区二区三级视频 | 一区二区不卡 | 久久av一区 | 亚洲电影专区 | 国产一区二区三区在线免费 | 久久成人高清视频 | 九九国产| xxx.在线观看 | 91av导航 | 日本不卡一区二区三区在线观看 | 久久午夜视频 | 国产亚洲网站 | 日韩一级精品视频在线观看 | 久久国产高清视频 | 国产一级片网站 | 一级黄色毛片a | 蜜桃视频成人 | 久草在线在线精品观看 | 免费黄色录像片 | 亚洲欧美一区二区三区在线 | 欧美三级视频在线观看 | 成人免费高清 | 三级成人片 | 一级日韩 | 国产乱肥老妇国产一区二 | 精品欧美一区二区三区久久久 | 国产福利91精品 | 91视频在线看 |