成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<kbd id="waoec"><strong id="waoec"></strong></kbd>

<abbr id="waoec"><code id="waoec"></code></abbr>

<s id="waoec"></s>

<input id="waoec"><th id="waoec"></th></input><abbr id="waoec"></abbr>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

MiniMax 發(fā)布 M1 大模型，百萬Token上下文+MoE架構(gòu)，只花了 GPT-4 的零頭！

2025-06-18 16:42:38

大上下文也很燒錢，處理這么長的輸入輸出意味著更大的內(nèi)存占用和更高的計算量。而 MiniMax-M1 把這件事“做得便宜”。據(jù)官方披露，M1 的訓(xùn)練總成本僅為 53.47 萬美元，約為 DeepSeek R1 的十分之一，而之前的GPT-4 更是要上億美金起步。

近日，國內(nèi) AI 初創(chuàng)公司 MiniMax 發(fā)布了一款全新的語言大模型 MiniMax-M1。

有兩個方面最引人注目：

1.高達(dá)100萬Token的上下文處理能力。

2.極具競爭力的訓(xùn)練成本效益。

M1 那個“1,000,000 token 上下文窗口”的數(shù)字，它幾乎是 GPT-4o 的 8 倍，是大多數(shù)企業(yè)內(nèi)用 LLM 一次上下文能處理信息量的極限突破。

大上下文也很燒錢，處理這么長的輸入輸出意味著更大的內(nèi)存占用和更高的計算量。而 MiniMax-M1 把這件事“做得便宜”。據(jù)官方披露，M1 的訓(xùn)練總成本僅為 53.47 萬美元，約為 DeepSeek R1 的十分之一，而之前的GPT-4 更是要上億美金起步。

據(jù)說，這要?dú)w功于兩個設(shè)計巧思：其一是 CISPO，這種自研的強(qiáng)化學(xué)習(xí)算法用更聰明的采樣方式節(jié)省了大量重復(fù)訓(xùn)練成本；其二是混合專家架構(gòu)（MoE）+ 快速注意力機(jī)制，它只激活最需要的那部分參數(shù)。

高性能，也可以很便宜

低成本并沒有犧牲性能。在多個重要基準(zhǔn)測試中，MiniMax-M1 的表現(xiàn)比 DeepSeek-R1 和 Qwen3 等知名開源模型更為突出。

圖片

在數(shù)學(xué)推理難題 AIME 2024 中，它的準(zhǔn)確率達(dá)到 86.0%。在代碼生成任務(wù) SWE-bench Verified 中取得 56.0%，在函數(shù)調(diào)用測試 TAU-bench 中得分 62.8%。這些數(shù)據(jù)意味著它不僅“看得懂”長文本，還能“用得上”。

盡管與 GPT-4o、Gemini Pro 2.5 等封閉式頂級模型相比，它仍存在通用理解能力上的差距，特別是在高維復(fù)雜指令、語言微妙語境等任務(wù)中，但在開源模型陣營中，它已進(jìn)入第一梯隊。

圖片

其次，MiniMax-M1 保持了完整開放：Apache-2.0 協(xié)議，支持商用、修改、永久免費(fèi)使用。這讓它在技術(shù)價值之外，也具備戰(zhàn)略價值——它是任何一家企業(yè)都可以“據(jù)為己有”的大模型。

據(jù)說，M1是全球首個開源大規(guī)?；旌霞軜?gòu)的推理模型。

而在產(chǎn)品策略上，MiniMax 并沒有追求全面均衡，而是選擇了“關(guān)鍵能力超配”的方向：超長上下文、極低計算成本、易部署的架構(gòu)和極寬松的許可。

它有兩個版本：40k 和 80k tokens 輸出上限，分別對應(yīng)不同推理預(yù)算。這種設(shè)置非常工程化——越多預(yù)算帶來更完整的推理，但也更慢更貴。MiniMax 把決策權(quán)交還給開發(fā)者和企業(yè)用戶，讓他們自己調(diào)節(jié)“速度-成本-性能”三者之間的平衡。

它還原生支持 structured function calling，適配 vLLM 和 Transformers 等主流框架，可快速集成進(jìn)已有基礎(chǔ)設(shè)施，構(gòu)建具備“智能體”能力的產(chǎn)品。它甚至預(yù)裝了搜索、視頻生成、語音合成等多模態(tài)能力插件，為應(yīng)用構(gòu)建節(jié)省了大量研發(fā)資源。

這并不是“另一個大模型”，而是一個面向未來任務(wù)形態(tài)的基礎(chǔ)設(shè)施嘗試。

責(zé)任編輯：武曉燕來源：大數(shù)據(jù)文摘

M1 大模型架構(gòu)

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

主站蜘蛛池模板：免费在线观看成年人视频 | 亚洲一级二级三级 | 中文字幕第三页 | 男人久久天堂 | 久久精品日产第一区二区三区 | 日本小电影网站 | 国产精品久久久亚洲 | 高清18麻豆 | 美女毛片免费看 | 中文字幕一级毛片 | 中文字幕日韩三级 | 国产亚洲日本精品 | 亚洲每日更新 | 亚洲视频中文字幕 | 综合精品 | 欧美日产国产成人免费图片 | 97精品一区二区 | 亚洲码欧美码一区二区三区 | 激情91| 亚洲看片网站 | 夜夜草 | 精品少妇一区二区三区日产乱码 | 亚洲精品一区二区三区四区高清 | 亚洲精品一区中文字幕 | 久久人爽 | 亚洲一区二区三区免费在线 | 91精品国产91久久综合桃花 | 精品二区 | 亚洲成人蜜桃 | 一区二区三区在线播放视频 | 精品国产乱码久久久久久88av | 亚洲综合婷婷 | 中文字幕在线视频网站 | 一区二区在线不卡 | 亚洲视频一区二区三区 | 99re超碰| 九九热这里 | 蜜臀久久 | 日日日日日日bbbbb视频 | 欧美日产国产成人免费图片 | 欧美日韩国产欧美 |

<abbr id="eu8cc"><code id="eu8cc"></code></abbr>

<abbr id="eu8cc"><code id="eu8cc"></code></abbr>

<bdo id="eu8cc"></bdo>

<blockquote id="eu8cc"></blockquote>

<kbd id="eu8cc"><code id="eu8cc"></code></kbd>

<center id="eu8cc"></center>