成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

顛覆LLM格局!AI2新模型OLMo2,訓練過程全公開,數據架構雙升級

人工智能 新聞
非營利研究機構AI2近日推出的完全開放模型OLMo 2,在同等大小模型中取得了最優性能,且該模型不止開放權重,還十分大方地公開了訓練數據和方法。

最近,非營利研究機構AI2上新了OLMo2系列模型,他們稱之為「迄今為止最好的完全開源模型」。

圖片

OLMo 2系列包含7B和13B兩個型號,相比如Llama 3.1和Qwen 2.5等開源模型達到了同等甚至更優的性能,同時FLOPS計算量更少,在性能和計算效率之間取得了極佳的平衡,為開源LLM開辟了新的可能性。

圖片

不同大小開源模型的性能對比,OLMo 2的表現優于同參數規模模型

在多個下游任務上,OLMo 2展現出了強大的泛化能力和適應能力。在10個基準上,OLMo-2-13B的性能全面超越了Llama-2-13B,OLMo-2-8B的基準均分也超過了Llama-3.1-8B。

圖片

訓練過程全公開

不同于Llama、Qwen這類只開源模型權重的項目,這次AI2也秉持了一貫的開源風格,即不止發布了訓練好的OLMo 2模型權重,還公開了訓練數據、代碼、訓練過程。這無疑為之后的LLM的研究和應用提供了寶貴的資源。

圖片

論文地址:https://arxiv.org/pdf/2501.00656

OLMo 2的訓練過程分為3個階段,分別是預訓練、中期訓練和后期的指令調優。預訓練數據混合了高質量的網頁數據、代碼數據和學術論文數據等。

在預訓練階段,OLMo 2通過多種技術改進了訓練穩定性,例如過濾重復的n-gram、使用更好的初始化方法、架構改進和超參數調整。這確保了模型在訓練過程中不會出現崩潰或損失激增,從而提高了最終模型的性能。

圖片

預訓練使用的高質量數據集

中期訓練階段使用高質量的領域特定數據(例如數學數據),以及合成數據,來增強模型的能力,特別是在數學任務上的表現;加上微退火技術評估以及選擇高質量的數據源,進一步優化了中期訓練的效果。

圖片

中期訓練使用的高質量數據集

最后的指令調優階段,研究人員基于Tülu 3的指令調優方法,開發了OLMo 2-Instruct模型,專注于使用許可數據,并擴展最終階段的強化學習與可驗證獎勵(RLVR)。

此外,監督微調(SFT)、直接偏好優化(DPO)和RLVR等多階段訓練,顯著提高了模型的指令跟隨能力和生成質量。

OLMo 2的開源是全方位的,包括所有用于復制和擴展這些模型所需的訓練和評估代碼、數據集、模型檢查點、日志及超參數的選擇等,相比只開源權重,使更多研究人員和開發者能夠使用和改進這些模型。

通過開源所有組件,OLMo 2促進了對語言模型行為和使用的理解和研究,促進語言模型研究的透明度和可重復性,這些足以成為之后研究所依賴的基礎設施。

圖片

OLMo 2 7B和13B模型的訓練過程中的超參數

多管齊下造就「低碳」LLM

在大規模語言模型訓練中,計算資源和環境影響是不可忽視的因素。Deepseek V3能夠以20分之一的成本進行訓練,而OLMo 2團隊也通過減少主機-設備同步、數據預處理、數據緩存等多種方法降低了訓練成本,并取得了顯著的成效。

OLMo 2的訓練主要在兩個集群上進行:Jupiter和Augusta。Jupiter集群配備了128個節點,每個節點有8張H100,總共1024個GPU;Augusta集群由160個A3 Mega虛擬機組成,每個虛擬機也有8張H100,總共1280個GPU。

OLMo 2的7B模型在4.05萬億token上進行訓練,13B模型在5.6萬億token上進行訓練。訓練時間取決于模型的參數規模和訓練數據量。

同時為了降低能源消耗,團隊使用水冷系統來降低GPU的溫度和功耗,從而提高訓練效率并降低電力成本。

這些措施加在一起,相比訓練同大小的Llama 3.1所消耗的1022MWh電力,OLMo 2 7B訓練過程中總計只消耗了131MWh的電力,相當于只有約10分之一的耗電量,顯著降低了訓練過程消耗的算力,能源及碳足跡。

圖片

OLMo 和Llama訓練能耗的對比

OLMo 2的發布,標志著開源LLM的持續進步,為相關領域的研究建立一個新生態系統。在這個生態系統中,新的訓練方法和技術需要被理解和分享。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-02-04 09:17:00

模型數據

2023-06-15 14:06:13

2021-07-30 18:35:57

數據建模聚類

2024-11-12 09:20:03

神經網絡語言模型

2025-02-17 14:34:52

2024-08-19 13:16:16

2025-03-25 09:04:55

2025-02-03 00:00:01

Ai2o1LLM

2024-11-26 10:44:18

2023-09-18 13:13:00

人工智能訓練

2025-03-03 10:42:50

深度學習PyTorch大型語言模型

2023-06-25 13:37:09

GPT-4AI

2024-12-10 16:00:00

AI開源

2025-06-13 09:29:51

2025-02-12 13:42:25

2024-04-25 09:25:33

2010-05-11 22:13:53

數據中心虛擬化H3C

2023-12-01 14:34:42

AnthropicAILLM

2024-12-19 09:48:59

2012-12-03 15:53:38

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲一区二区精品视频在线观看 | 国产一区二区久久 | 97偷拍视频 | 日韩精品一区二区三区在线播放 | 国产日韩精品在线 | 亚洲欧美中文日韩在线v日本 | 91福利电影在线观看 | 国产精品视频久久久 | a欧美 | 欧美性极品xxxx做受 | 国产视频不卡一区 | 在线免费国产 | 91福利在线观看视频 | 久久久精品一区 | 欧美日韩在线视频一区 | 免费一区在线 | 色婷婷久久综合 | 日本又色又爽又黄的大片 | 免费国产黄 | 最新91在线| 欧美xxxx性 | 欧美一级毛片在线播放 | h视频在线观看免费 | 亚洲成人精品免费 | 日本精品一区二区三区视频 | 亚洲三级视频 | 欧美中文字幕在线观看 | a精品视频| 成年网站在线观看 | 亚洲三级av| 国产高清久久久 | 综合久久99| 亚洲精品视频在线看 | 久久黄色网 | 一区二区三区四区电影 | 成人在线免费视频观看 | 亚洲iv一区二区三区 | 国产一区二区三区四区在线观看 | 伊人免费在线观看 | 亚洲精品www久久久久久广东 | 久草在线|