成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Mistral殺回來了!Small 3.1開源發(fā)布,性能完勝Gemma 3,RTX 4090就能跑

發(fā)布于 2025-3-18 08:26
瀏覽
0收藏

Mistral 又搞了個 “小而美” 的狠貨: Mistral Small 3.1 發(fā)布并開源:

Mistral殺回來了!Small 3.1開源發(fā)布,性能完勝Gemma 3,RTX 4090就能跑-AI.x社區(qū)

號稱 “小 3.1”,但能力不 “小”。 多模態(tài)、開源 Apache 2.0 協(xié)議,關(guān)鍵是性能還杠杠的,直接 PK 掉 Gemma 3 和 GPT-4o mini。

Mistral殺回來了!Small 3.1開源發(fā)布,性能完勝Gemma 3,RTX 4090就能跑-AI.x社區(qū)

看 Benchmark 圖: 橫坐標(biāo)是速度,越小越快; 縱坐標(biāo)是知識,越大越強(qiáng)。 Mistral Small 3.1,直接霸榜左上角,速度、知識雙 Buff 加持。

Mistral殺回來了!Small 3.1開源發(fā)布,性能完勝Gemma 3,RTX 4090就能跑-AI.x社區(qū)

Mistral 官方列出了 Small 3.1 的關(guān)鍵特性和能力:

? 輕量級: 能在 RTX 4090 或 32GB 內(nèi)存的 Mac 上運(yùn)行,適合本地部署。

? 快速響應(yīng): 適合虛擬助手等需要快速響應(yīng)的應(yīng)用。

? 低延遲函數(shù)調(diào)用: 能快速執(zhí)行函數(shù)。

? 領(lǐng)域微調(diào): 能針對特定領(lǐng)域進(jìn)行微調(diào),比如法律、醫(yī)療等。

? 高級推理基礎(chǔ): 社區(qū)可以在此基礎(chǔ)上構(gòu)建更強(qiáng)的推理模型。

最近幾周,已經(jīng)有一些基于 Mistral Small 3 的優(yōu)秀推理模型出現(xiàn),比如Nous Research 的 DeepHermes 24B。Mistral 同時發(fā)布了基礎(chǔ)模型和指令調(diào)優(yōu)的 checkpoint,方便大家進(jìn)一步定制。

“AI 智能,兩周一降價”, 這趨勢有點(diǎn)猛。

有人分析 Mistral Small 3.1,覺得這模型潛力巨大。 雖然現(xiàn)在還不是原生多模態(tài),但 Mistral 可能會憋個大的,直接搞個原生多模態(tài)模型出來。

參數(shù) 30B 左右,各種模態(tài)都支持。 要是真成了,說不定能再現(xiàn) Mistral 7B 的 “經(jīng)典時刻”。

Mistral Small 3.1 的基準(zhǔn)測試成績

多張圖。

先看多語言能力,Mistral Small 3.1 在歐洲、東亞、中東語言上平均值領(lǐng)先。

Mistral殺回來了!Small 3.1開源發(fā)布,性能完勝Gemma 3,RTX 4090就能跑-AI.x社區(qū)

長上下文方面,Mistral Small 3.1 只有在RULER 上不如 Claude-3.5 Haiku。

多模態(tài)指令上,Mistral Small 3.1 都有顯著優(yōu)勢。

Mistral殺回來了!Small 3.1開源發(fā)布,性能完勝Gemma 3,RTX 4090就能跑-AI.x社區(qū)

文本指令上,Mistral Small 3.1 在 SimpleQA 、GPQA Main、GPQA Diamond 上領(lǐng)先。在 MMLU、MMLU Pro、HumanEval、MATH 上,也是有高有低。

Mistral殺回來了!Small 3.1開源發(fā)布,性能完勝Gemma 3,RTX 4090就能跑-AI.x社區(qū)


有網(wǎng)友指出,Mistral Small 3.1 參數(shù)多、支持多語言、多模態(tài),還沒啥限制,就是推理能力差點(diǎn)意思。

Mistral殺回來了!Small 3.1開源發(fā)布,性能完勝Gemma 3,RTX 4090就能跑-AI.x社區(qū)

但馬上有人潑冷水,說簡單任務(wù)用推理模型就是 “高射炮打蚊子”, 太啰嗦。 他們更喜歡輕量級的模型處理日常小事。

推理能力不是萬金油。 像低延遲翻譯,速度才是硬道理,要啥推理? 

并且這個模型還開源:

Mistral殺回來了!Small 3.1開源發(fā)布,性能完勝Gemma 3,RTX 4090就能跑-AI.x社區(qū)

有人覺得 Mistral 完勝, gpt4o-mini 不行。

反方表示,GPT-4 級別大模型的 “底蘊(yùn)” 還是在那兒,小模型就算加了 RL 也比不了, “隱含知識” 就是值錢。

而又說到基準(zhǔn)測試,有眼尖的網(wǎng)友表示:

“ 這測試選的,也太奇怪了吧?對比的模型也怪怪的。Mistral Small 3.0 呢?藏哪兒去了?是不是怕露餡?”

“ 還有,有些地方 Mistral Small 3.1 只是勉強(qiáng)贏了 Gemma3-it-27b,之前 3.0 可是碾壓的啊,這啥情況?”

Mistral殺回來了!Small 3.1開源發(fā)布,性能完勝Gemma 3,RTX 4090就能跑-AI.x社區(qū)

對此,網(wǎng)友表示:“ 最近的模型,都喜歡挑對自己有利的測試,Mistral 更狠,直接無視中國的模型… ”

Mistral殺回來了!Small 3.1開源發(fā)布,性能完勝Gemma 3,RTX 4090就能跑-AI.x社區(qū)

本文轉(zhuǎn)載自AI進(jìn)修生,作者:Aitrainee


收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 久久精品99国产精品 | 久久一区| 欧美视频成人 | 福利片在线 | 999久久久 | 亚洲精品1| 精品一级 | 超碰成人免费 | 久久免费精彩视频 | 91人人看| 最近日韩中文字幕 | www久久 | 精品一区二区三区91 | 日本成人午夜影院 | 污污免费网站 | 久久久久久免费毛片精品 | 亚洲国产精品美女 | 黄色免费在线观看网站 | 亚洲精品国产电影 | 欧美激情综合 | 国产免费一区 | 国产免费一级片 | 精品国产久 | 日韩无 | 日韩精品一区二区三区四区视频 | 精品久久香蕉国产线看观看亚洲 | 天天躁日日躁狠狠躁2018小说 | 国产91在线播放精品91 | 日本韩国电影免费观看 | 久久久久久免费毛片精品 | 久久久久久国产精品免费 | 国产成人精品区一区二区不卡 | 久久久国产一区 | 视频一区二区国产 | 人人干人人爽 | a网站在线观看 | 久久精品一 | 久久777 | 亚洲欧美成人 | 国产一区二区av | 久久夜夜|