Ai2開源OLMo 2：數據集、訓練方法、權重大放送

Aceryt

發布于 2024-11-29 09:42

瀏覽

0收藏

AI研究機構Ai2開源了最新大模型OLMo 2，這是一款在各方面都真正開放的人工智能模型。

OLMo，即Open Language Model，與Llama和Gemma等流行的開放權重模型不同，它不僅提供模型權重，還包括了工具、數據集、訓練配方等所有用于開發模型的內容。

OLMo 2包括了7B和13B兩個參數版本，能力都相當優秀。7B版本在英語學術基準測試中超越了Meta的Llama 3.1 8B，而13B版本即使在訓練時使用的計算能力較少的情況下，也超過了Qwen 2.5 7B。

開源地址：https://huggingface.co/allenai/OLMo-2-1124-7B

Ai2開源OLMo 2：數據集、訓練方法、權重大放送-AI.x社區

OLMo 2的發布是基于今年早些時候發布的首個OLMo模型，Ai2團隊采用了創新的兩階段訓練方法。他們首先在包含3.9萬億token的大型數據集上進行訓練，然后使用來自學術內容、數學練習冊和指令集的高質量數據進行優化。

團隊特別關注訓練的穩定性，并對此進行了關鍵的改進，以防止在長時間的訓練過程中出現性能下降的情況。

此次發布還建立在Ai2近期與開源訓練系統Tülu 3合作的基礎之上。Tülu 3是一個復雜的后訓練過程，它使得OLMo 2具備了與世界上一些最佳模型相當的指令跟隨任務能力。

完整的發布內容還包括了評估框架和中間檢查點，這些工具可以幫助開發人員深入理解并進一步提升OLMo 2的能力。

本文轉自 AIGC開放社區，作者：AIGC開放社區

原文鏈接:??https://mp.weixin.qq.com/s/Pqk62_DeQU0eRghDyfvKsQ??

標簽

模型

開源

贊

回復

舉報

回復

相關推薦

2萬億訓練數據，120億參數！開源大模型Stable LM 2-12B

Aceryt ? 3989瀏覽 ? 0回復
開源15T tokens！HuggingFace放出規模最大、質量最高預訓練數據集

duhorse ? 3583瀏覽 ? 0回復
值得細讀的八個視覺大模型生成式預訓練方法

angel ? 6063瀏覽 ? 0回復
AI2驚艷發布OneDiffusion：突破性大規模擴散模型，支持多任務生成與理解，重塑視覺AI應用

angel ? 3199瀏覽 ? 0回復
大模型三階段訓練方法(LLaMa Factory)

一起AI技術 ? 1.3w瀏覽 ? 0回復
艾倫人工智能研究所 (AI2) 發布 OLMo 2：在多達 5T 代幣上訓練的新系列開源 7B 和 13B 語言模型

Halo咯咯 ? 4020瀏覽 ? 0回復
革命性AI學習方法OptiDEL：用5%的數據超越全數據集性能！

AI論文解讀 ? 2230瀏覽 ? 0回復
大模型訓練之訓練數據準備，即怎么準備高質量的訓練數據集？

AI探索時代 ? 3755瀏覽 ? 0回復
蘋果開源通用視覺模型：創新訓練方法，超1000顆星

Aceryt ? 1886瀏覽 ? 0回復
模型訓練之數據集操作——矩陣變換

AI探索時代 ? 1875瀏覽 ? 0回復
Phi-4-multimodal：圖、文、音頻統一的多模態大模型架構、訓練方法、數據細節

大模型自然語言處理 ? 2303瀏覽 ? 0回復
多模態大模型Ovis核心技術點、訓練方法、數據細節

大模型自然語言處理 ? 2060瀏覽 ? 0回復
Qwen-VL系列多模態大模型技術演進-模型架構、訓練方法、數據細節

大模型自然語言處理 ? 5111瀏覽 ? 0回復
媲美OpenAI-o3，剛剛開源模型DeepCoder，訓練方法、數據集大公開

Aceryt ? 1581瀏覽 ? 0回復
英偉達開源15T數據集：32萬個機器人訓練軌跡

Aceryt ? 1650瀏覽 ? 0回復
Kimi-VL開源多模態大模型結構、訓練方法、訓練數據淺析

大模型自然語言處理 ? 1689瀏覽 ? 0回復
Encoder-free無編碼器多模態大模型EVEv2模型架構、訓練方法淺嘗

大模型自然語言處理 ? 1100瀏覽 ? 0回復
Qwen3模型架構、訓練方法梳理

大模型自然語言處理 ? 2520瀏覽 ? 0回復
Qwen3 Embedding模型架構、訓練方法、數據策略

大模型自然語言處理 ? 764瀏覽 ? 0回復

Aceryt

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學堂

Ai2開源OLMo 2：數據集、訓練方法、權重大放送

目錄