成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

MiniMax開源4M超長上下文新模型!性能比肩DeepSeek-v3、GPT-4o

人工智能 新聞
MiniMax-01首次大規(guī)模擴展了新型Lightning Attention架構,替代了傳統(tǒng)Transformer架構,使模型能夠高效處理4M token上下文。

開源模型上下文窗口卷到超長,達400萬token!

剛剛,“大模型六小強”之一MiniMax開源最新模型——

MiniMax-01系列,包含兩個模型:基礎語言模型MiniMax-Text-01、視覺多模態(tài)模型MiniMax-VL-01。

MiniMax-01首次大規(guī)模擴展了新型Lightning Attention架構,替代了傳統(tǒng)Transformer架構,使模型能夠高效處理4M token上下文。

圖片

在基準測試中,MiniMax-01性能與頂級閉源模型表現(xiàn)相當。

MiniMax-Text-01性能與前段時間大火的DeepSeek-V3、GPT-4o等打的有來有回:

圖片

如下圖(c)所示,當上下文超過20萬token,MiniMax-Text-01的優(yōu)勢逐漸明顯。

圖片

在預填充延遲方面也有顯著優(yōu)勢,在處理超長上下文時更高效,延遲更低:

圖片

網(wǎng)友直呼“難以置信”:

圖片

開放權重,擁有400萬token的上下文窗口!我原本以為這可能要五年后才會實現(xiàn)。

圖片

官方表示,MiniMax-01是為支持之后Agent相關應用而預備的:

因為Agent越來越需要擴展的上下文處理能力和持續(xù)的內(nèi)存。

目前官方還公開了MiniMax-01的68頁技術論文,并且已將MiniMax-01在Hailuo AI上部署了,可免費試用。

圖片

另外,新模型API價格也被打下來了:

輸入每百萬token0.2美元,輸出每百萬token1.1美元。

圖片

下面是模型更多細節(jié)。

4M超長上下文

MiniMax-Text-01

MiniMax-Text-01,參數(shù)456B,每次推理激活45.9B。

它創(chuàng)新性地采用了混合架構,結合了Lightning Attention、Softmax Attention以及Mixture-of-Experts(MoE)

圖片

并且通過LASP+、varlen ring attention、ETP等優(yōu)化的并行策略和高效的計算通信重疊方法,MiniMax-Text-01訓練上下文長度達100萬token,推理時可以擴展到400萬token上下文。

模型架構細節(jié)如下:

圖片

在Core Academic Benchmark上,MiniMax-Text-01在GPQA Diamond上獲得54.4分,超越GPT-4o。

圖片

在長基準測試之4M大海撈針測試,MiniMax-Text-01一水兒全綠。

也就是說,這400萬上下文里,有細節(jié)MiniMax-Text-01是真能100%捕捉到。

圖片

除此之外,還有LongBench v2、Ruler基準測試,考驗的是模型長上下文理解能力,包含基于長上下文輸入的邏輯推理能力。

MiniMax-Text-01模型在處理Ruler的長上下文推理任務時表現(xiàn)出顯著的優(yōu)勢。

在64K輸入級別的表現(xiàn)與頂尖模型GPT-4o、Claude-3.5-Sonnet等競爭力相當,變化微小,但從128K開始顯現(xiàn)出明顯的優(yōu)勢,并超越了所有基準模型。

圖片

LongBench-V2包括不同難度級別的問答任務,涵蓋多種上下文類型,包括單文檔和多文檔、多輪對話、代碼倉庫和長結構化數(shù)據(jù)等。團隊考慮了兩種測試模式:不使用思維鏈推理(w/o CoT)和使用思維鏈推理(w/ CoT)。

MiniMax-Text-01在w/ CoT設置中實現(xiàn)了所有評估系統(tǒng)中的最佳結果,在w/o CoT中表現(xiàn)也很顯著。

圖片

團隊還用MTOB( Machine Translation from One Book)數(shù)據(jù)集評估了模型從上下文中學習的能力。

該任務要求模型在英語和Kalamang(一種在公開數(shù)據(jù)中非常有限的語言)之間進行翻譯,因此在訓練語料庫中,LLM僅從一部語法書的部分內(nèi)容和375個翻譯示例中學習該語言。

測試結果顯示,MiniMax-Text-01在無上下文場景下eng→kalam (ChrF)得分最低,團隊認為其它模型可能是在預訓練或后訓練數(shù)據(jù)中集加入了kalam相關數(shù)據(jù)。在delta half book和full book上,MiniMax-Text-01超過了所有模型。

在kalam→eng(BLEURT)得分上MiniMax-Text-01也與其它模型表現(xiàn)相當。

圖片

MiniMax-VL-01

MiniMax-VL-01采用多模態(tài)大語言模型常用的“ViT-MLP-LLM”框架:

  • 一個具有3.03億參數(shù)的ViT用于視覺編碼
  • 一個隨機初始化的雙層MLP projector用于圖像適配
  • 以及作為基礎LLM的MiniMax-Text-01

MiniMax-VL-01特別具有動態(tài)分辨率功能,可以根據(jù)預設網(wǎng)格調(diào)整輸入圖像的大小,分辨率從336×336到2016×2016不等,并保留一個336×336的縮略圖。

調(diào)整后的圖像被分割成大小相同的不重疊塊,這些塊和縮略圖分別編碼后組合,形成完整的圖像表示。

MiniMax-VL-01的訓練數(shù)據(jù)涵蓋標題、描述和指令。ViT從頭開始在6.94億圖像-標題對上進行訓練。在訓練過程的四個階段,處理了總計5120億token。

最終,MiniMax-VL-01 在多模態(tài)排行榜上表現(xiàn)突出,證明了其在處理復雜多模態(tài)任務中的優(yōu)勢和可靠性。

圖片
圖片

網(wǎng)友們已開始第一波實測

得知新模型已在Hailuo AI上部署,網(wǎng)友們已緊忙趕往測試。

圖片

有網(wǎng)友使用相同的prompt將它和Gemini、o1對比,感嘆MiniMax-01表現(xiàn)令人印象深刻。

圖片

下面這個測試也沒能難倒它:

給我5個奇數(shù),這些數(shù)的英文拼寫中不包含字母“e”。

圖片

感興趣的童鞋可以玩起來了。

技術論文:https://filecdn.minimax.chat/_Arxiv_MiniMax_01_Report.pdf

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-07-23 12:32:11

2024-04-03 10:05:00

LLM性能基準測試

2024-01-17 13:59:00

AI開源

2025-04-16 09:15:00

AI模型數(shù)據(jù)

2023-12-08 13:21:00

模型訓練

2025-06-18 16:42:38

2024-09-06 13:00:29

2024-05-15 07:54:12

GPT-4oAI助手人工智能

2025-04-15 07:41:18

2025-04-08 02:26:00

2025-01-15 13:09:12

2024-05-14 11:29:15

2025-04-21 16:27:18

AIGPT?3.5工具

2024-05-21 12:23:17

2025-05-26 09:05:00

2024-06-27 12:45:30

2024-08-14 14:30:00

AI訓練

2023-09-11 15:57:16

人工智能模型GPT-4

2024-09-30 14:10:00

2024-06-05 08:29:35

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲视频在线免费 | 欧美精品一区二区三区在线播放 | 91精品国产综合久久福利软件 | 亚洲精品第一国产综合野 | 在线视频一区二区 | 国产免费一区二区三区 | 亚洲九九 | 久久成人精品视频 | 欧美精品一区二区在线观看 | 日韩欧美精品在线 | 日韩欧美在线观看 | 日本欧美在线视频 | 91社影院在线观看 | 欧美888 | 九九热免费视频在线观看 | 日韩精品一区二区三区 | 一区二区三区免费 | 国产成人精品999在线观看 | 国产精品爱久久久久久久 | 久热久草| 91日韩在线| h肉视频| 欧美aⅴ在线观看 | 久久伊| 黄色毛片网站在线观看 | 日韩欧美精品 | 波多野结衣一区二区 | 精品日韩在线 | 久久久久久国产 | 网络毛片 | 久久av一区二区三区 | 亚洲精品视 | 鲁一鲁资源影视 | 国产高清免费在线 | 91久久看片| 亚洲视频一区二区三区 | 特黄小视频 | 国产aⅴ爽av久久久久久久 | 国产一区二区免费 | 亚洲色在线视频 | 欧美成人精品欧美一级 |