探討大模型預訓練與微調之間的相互作用

發布于 2025-3-5 10:55

瀏覽

0收藏

今天給大家帶來一篇探討大模型預訓練與微調之間關系的文章，主要通過微調預訓練階段各個checkpoint，來發現預訓練本身或對下游微調有哪些影響。

大模型在預訓練過程中的性能如何變化？
更多步數的預訓練對下游微調有何影響？
大模型微調學到了什么，又忘記了什么？

探討大模型預訓練與微調之間的相互作用-AI.x社區

Paper: https://arxiv.org/abs/2408.06663

由于目前開源模型中，開放全量checkpoints的模型較少，并且實驗成本較大，以下分析結果主要基于OLMo-1B模型（同時訓練細節、預訓練數據、微調數據都公開了）進行實驗，微調數據詳細如下表所示，

探討大模型預訓練與微調之間的相互作用-AI.x社區

大模型在預訓練過程中的性能如何變化？

探討大模型預訓練與微調之間的相互作用-AI.x社區

針對大模型在預訓練過程中的checkpoints，進行下游任務zero-shot或few-shot測試，如上圖可以發現，大模型隨著訓練步數的增加，并不是所有任務數據的效果會隨之提高，部分任務數據在整個預訓練過程中，基本沒有變化。效果提高的任務數據，也主要在訓練前期提高較多，后期趨于平穩。

模型在預訓練過程中，更多在學習知識，即使學習更多，可能也不會使用。

更多步數的預訓練對下游微調有何影響？

探討大模型預訓練與微調之間的相互作用-AI.x社區

如上圖所示，可以發現，在預訓練時表現較好的任務數據，在微調過程中并不會得到改善，即在預訓練過程中已經獲取了知識信息，微調則沒有幫助。

但在預訓練階段表現不好的任務數據，微調模型的每個checkpoint都會有明顯的改善，一般微調收益先增加再減少。

探討大模型預訓練與微調之間的相互作用-AI.x社區

那么，如果模型在某一任務上一定需要下游微調時，可能早停的checkpoint效果更優。

大模型微調學到了什么，又忘記了什么？

從任務格式、任務遷移和領域知識三個維度來分析微調學到了哪些內容。

任務格式：利用三種任務格式（默認格式、IO格式、Intruct格式）驗證大模型在不同checkpoint上的性能。發現：在預訓練早期，微調格式與預訓練格式一致可以獲取更好的效果，隨著預訓練步數增加，大模型對格式的敏感性會隨之下降，可以變的更加靈活。微調階段可以教會大模型去適應任務格式。

探討大模型預訓練與微調之間的相互作用-AI.x社區

任務遷移：很多研究已經發現模型微調會導致某些任務的改進，但另一些任務的退化。通過實驗發現，在生成任務上微調，在其他生成任務和分類任務上驗證基本無下降；在分類任務上微調，在其他分類任務上無下降，但在分類任務上有明顯下降。

探討大模型預訓練與微調之間的相互作用-AI.x社區

領域知識：模型在學習其他能力之后，是否一定會遺忘微調之前擁有的領域知識。如下圖所示，對于不同任務的結論不一致，所有NLI數據在MNLI上微調后，都會得到提高；但在Paws微調后，其他釋義檢測數據集均有下降。意味著遺忘和學習都發生。

探討大模型預訓練與微調之間的相互作用-AI.x社區

本文轉載自NLP工作站，作者：劉聰NLP

標簽

大模型

預訓練

微調

贊

回復

舉報

回復

相關推薦

費米悖論與收益遞減，超級人工智能與人類社會將會怎樣相互作用

xuxiangda ? 2819瀏覽 ? 0回復
值得細讀的八個視覺大模型生成式預訓練方法

angel ? 6074瀏覽 ? 0回復
與ChatGPT的供應鏈數字化探討

ceesoft ? 3975瀏覽 ? 0回復
探討 | 大模型在傳統NLP任務的使用姿勢

NLP工作站 ? 3898瀏覽 ? 0回復
預訓練大語言模型對時間序列預測真的有用嗎？去掉預訓練LLM效果反而提升

海因斯DK ? 4872瀏覽 ? 0回復
大模型的訓練與調優，SFT(監督微調)和RLHF(基于人類反饋的強化學習)到底是什么？

AI探索時代 ? 8049瀏覽 ? 0回復
你真的了解預訓練嗎？預訓練與微調的區別是什么？

AI探索時代 ? 7231瀏覽 ? 0回復
大模型的核心之一——大模型預訓練之數據預處理

AI探索時代 ? 5093瀏覽 ? 0回復
REGMIX: 作為語言模型預訓練的回歸數據配比

sbf_2000 ? 3352瀏覽 ? 0回復
OLMoE: 開源的MoE語言模型(預訓練&效果)

sbf_2000 ? 2849瀏覽 ? 0回復
大模型的訓練與調優，SFT(監督微調)和RLHF(基于人類反饋的強化學習)到底是什么？

AI探索時代 ? 8739瀏覽 ? 0回復
關于大模型微調與訓練的問題，大模型訓練的難點在哪里？

AI探索時代 ? 2611瀏覽 ? 0回復
為什么預訓練大模型要使用無監督學習的方式？

AI探索時代 ? 2904瀏覽 ? 0回復
深入理解預訓練與微調，為什么需要預訓練，什么是微調？

AI探索時代 ? 4279瀏覽 ? 0回復
云計算與大模型訓練的結合

AI探索時代 ? 2182瀏覽 ? 0回復
FineMedLM-o1: 基于監督微調與測試時訓練的醫學推理增強型大語言模型

頓數AI ? 3193瀏覽 ? 0回復
LLM訓練數據綜述：預訓練與微調數據的規模、來源、類型及開源資源梳理

AIRoobt ? 1932瀏覽 ? 0回復
大模型預訓練代碼實戰教程

AI悠閑區 ? 824瀏覽 ? 0回復
大語言模型的全新預訓練范式-強化預訓練

sbf_2000 ? 882瀏覽 ? 0回復

NLP工作站

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學堂

探討大模型預訓練與微調之間的相互作用

大模型在預訓練過程中的性能如何變化？

更多步數的預訓練對下游微調有何影響？

大模型微調學到了什么，又忘記了什么？

目錄