成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<li id="mg0mg"></li>

<button id="mg0mg"></button>

<button id="mg0mg"></button>

<rt id="mg0mg"><acronym id="mg0mg"></acronym></rt>

<abbr id="mg0mg"></abbr>

<pre id="mg0mg"></pre>

<button id="mg0mg"></button>

<cite id="mg0mg"></cite>

<li id="mg0mg"></li>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

LLM基礎模型系列：Fine-Tuning總覽原創

發布于 2024-7-10 09:17

瀏覽

0收藏

由于對大型語言模型，人工智能從業者經常被問到這樣的問題：如何訓練自己的數據？回答這個問題遠非易事。生成式人工智能的最新進展是由具有許多參數的大規模模型驅動的，而訓練這樣的模型LLM需要昂貴的硬件（即許多具有大量內存的昂貴GPU）和花哨的訓練技術（例如，完全分片的數據并行訓練）。

幸運的是，這些模型通常分兩個階段進行訓練——預訓練和微調。其中前一個階段（要）昂貴得多。鑒于高質量的預訓練LLMs很容易在網上獲得，大多數人工智能從業者可以簡單地下載一個預訓練的模型，并專注于使這個模型（通過微調）適應他們想要的任務。

“就所需的硬件和為不同任務托管獨立實例的存儲/交換成本而言，微調龐大的語言模型的成本高得令人望而卻步?！?/p>

模型的大小并沒有在微調過程中改變。因此微調一個LLM雖然比預訓練便宜，可是也不是易事，仍然需要訓練技術和硬件來處理這樣的模型。每次微調運行都會創建一個完全獨立的“副本”。

參數高效微調（PEFT）是微調一種比較好的技術，它不是端到端地訓練完整的模型，而是固定預訓練的模型權重，并且在微調期間僅調整少量特定于任務的參數。這種方法大大減少了內存開銷，簡化了存儲/部署過程，并允許使用更易于訪問的硬件進行微調LLMs。

1.微調與轉移學習

LLM基礎模型系列：Fine-Tuning總覽-AI.x社區

首先先來明確兩個概念，微調和轉移學習。轉移學習是將一個通用的預訓練模型應用到全新的但是相關領域的過程。而微調是將通用的預訓練模型進一步的訓練。一般而言，微調是包含轉移學習的。

LLM基礎模型系列：Fine-Tuning總覽-AI.x社區

上圖展示了預訓練，特征提取和微調的過程，預訓練就是使用訓練數據直接訓練基礎模型，比較常見的有T5，BloombergGPT，GPT-4。特征提取一般是利用基礎模型進行內容的Embedding，然后在另接其他的模型進行預測，例如Bert。微調是利用訓練數據訓練完基礎模型，然后采用微調技術（例如更新部分參數，更新所有層或者額外添加層）進行二次訓練。

微調和Prompt Engineering（通過提示詞優化結果，基礎模型的參數是凍結的，經常在論文中會用雪花圖標標識）不同，它重新精校模型參數的數值。若是全部精校所有的參數，讀者需要大量的計算資源。

LLM基礎模型系列：Fine-Tuning總覽-AI.x社區

上圖為2018年的一篇論文的插圖，有三幅圖片分別代表著：a為預訓練，b為全量參數微調，c為分類器微調。

LLM基礎模型系列：Fine-Tuning總覽-AI.x社區

Instruction-tuned就是全量微調中的一種，FLAN在基礎模型上面，通過指令調整（在通過指令描述的數據集集合上微調語言模型）可以顯著提高未見任務的零樣本性能。它采用 137B參數預訓練語言模型，并在通過自然語言指令模板表達的60多個NLP數據集上對其進行指令調整。

LLM基礎模型系列：Fine-Tuning總覽-AI.x社區

FLAN 顯著提高了其未修改版本的性能，并在評估的25個數據集中的20個數據集上超越了零樣本175B GPT-3。FLAN 甚至在 ANLI、RTE、BoolQ、AI2-ARC、OpenbookQA和StoryCloze上的表現遠遠優于少樣本 GPT-3。消融研究表明，微調數據集的數量、模型規模和自然語言指令是指令調整成功的關鍵。大白話而言，它將這些數據集根據不同的模版構建不同的指令訓練樣本，然后再次訓練模型：

LLM基礎模型系列：Fine-Tuning總覽-AI.x社區

全量微調是美味的，但是若沒有太多的計算資源，那么存在兩種方法可以在有限的資源下將模型調教得較為服帖。一種是X-shot Prompt，這點在介紹Dspy的時候說過了。另外一種是高效參數微調（微調部分參數），簡稱PEFT（Parameter-efficient fine tuning）。本系列還是會將重點放在PEFT的技術上面。

2.PEFT概覽

最后先來看看PEFT的技術分類和全景圖，大致可分為四類：

LLM基礎模型系列：Fine-Tuning總覽-AI.x社區

Additive PEFT：通過注入新的可訓練模塊或參數來修改模型架構；Selective PEFT：使選擇部分的參數子集在微調期間可訓練，其余的凍結；
Reparameterization PEFT：將原來的參數重新結構化，比如用低軼矩陣重新表示以進行訓練，然后等效地將其轉換推理。
Hybrid PEFT，它結合了不同PEFT方法的優點，建立了一個統一的PEFT模型。

LLM基礎模型系列：Fine-Tuning總覽-AI.x社區

上圖為各種算法，都是圍繞著各種主流微調技術的微調方法，比如之前的文章已經介紹過的LoRA，后續將圍繞這根主線開展學習之旅。

本文轉載自 ??魯班模錘??，作者：龐德公

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

贊

收藏

回復

舉報

回復

相關推薦

IBM巨獻：用于代碼智能的Granite Code系列開放基礎模型

xuxiangda ? 5186瀏覽 ? 0回復
編碼大模型系列：Meta創新的“代碼編譯優化”的LLM

魯班模錘1 ? 4109瀏覽 ? 0回復
LLM基礎模型系列：Prompt-Tuning

探索AGI ? 3416瀏覽 ? 0回復
大模型高效微調Prompt Tuning論文解讀

AIRoobt ? 5300瀏覽 ? 0回復
LLM基礎模型系列：深入注意力機制

魯班模錘1 ? 3270瀏覽 ? 0回復
LLM實踐系列-詳談Tokenizer訓練細節

NLP工作站 ? 3532瀏覽 ? 0回復
AI架構系列：vLLM, LMDeploy, MLC-LLM, TensorRT-LLM, and TGI的性能小實驗

魯班模錘1 ? 5055瀏覽 ? 0回復
多模態大模型：基礎架構

魯班模錘1 ? 2779瀏覽 ? 0回復
RAG 或 Fine Tume - 為您的用例選擇正確方法的權威指南

sulu637 ? 2254瀏覽 ? 0回復
LLM實踐系列-細聊LLM的拒絕采樣

NLP工作站 ? 3117瀏覽 ? 0回復
參數高效微調-Prefix Tuning、Adapter Tuning、LoRA

大模型自然語言處理 ? 3791瀏覽 ? 0回復
LLM背后的基礎模型6：一文入門Embeddings

魯班模錘1 ? 2252瀏覽 ? 0回復
RAG從入門到精通系列：基礎RAG

PyTorch研習社 ? 3199瀏覽 ? 0回復
LLM架構從基礎到精通之門控循環單元（GRUs）

柏企閱文 ? 3080瀏覽 ? 0回復
RAG 或 Fine Tume - 為您的用例選擇正確方法的權威指南

sulu637 ? 2280瀏覽 ? 0回復
一文帶你看懂開源大模型基石LLaMA核心技術點，DeepSeek/千問等LLM的模型結構基礎

海因斯DK ? 2616瀏覽 ? 0回復
DeepSeek R1 全系列模型部署指南

芝士AI吃魚 ? 9097瀏覽 ? 0回復
Dify從入門到高階系列一：詳解各種工作流節點，如何降低LLM開發門檻？

AI博物院 ? 6196瀏覽 ? 1回復
LLM實戰系列 | 大模型的多Lora部署，將顯存節省到極致

NLP工作站 ? 1099瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

ALPHAONE：從快到慢，還是從慢到快 1天前發布
Meta AI發布革命性V-JEPA 2 2025-06-15 23:41:42發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇：優雅談大模型：揭開計算機視覺任務神秘面紗

下一篇： FlashAttention3：“苗條”的就是比較好！

社區精華內容

目錄

主站蜘蛛池模板：日韩精品亚洲专区在线观看 | 国产9久 | 日韩波多野结衣 | 羞视频在线观看 | 精品国产乱码久久久久久88av | 国产激情视频在线免费观看 | 欧美精品一区二区三区四区在线 | 精品欧美二区 | 国产精品自拍视频 | 亚洲欧美另类在线观看 | 日本中出视频 | 天天综合亚洲 | 一区二区在线免费观看 | 一区二区三区高清 | 最新中文字幕久久 | 成人中文字幕av | 日日干天天干 | 亚洲国产高清高潮精品美女 | 成人a视频片观看免费 | 日韩1区 | 91久久精品国产91久久 | 欧美日韩亚洲91麻豆精品 | 日韩欧美久久 | 国产黄色精品 | 亚洲精品一区二区三区蜜桃久 | 久久亚洲欧美日韩精品专区 | 国产资源网 | 日韩国产免费观看 | 免费国产一区二区视频 | 日韩久久久久久 | 午夜久久久 | 美日韩免费 | 日本h片在线观看 | 日本久久精品视频 | 中国一级特黄毛片大片 | 久久久综合久久 | 一级片aaa | 老司机67194精品线观看 | 91精品国产综合久久福利软件 | 国产精品1区2区 | 麻豆视频国产在线观看 |

<nav id="syoyg"><dl id="syoyg"></dl></nav>

<button id="syoyg"></button>

<li id="syoyg"></li>

<code id="syoyg"></code>

<center id="syoyg"><acronym id="syoyg"></acronym></center>

<center id="syoyg"><acronym id="syoyg"></acronym></center>

<abbr id="syoyg"><menu id="syoyg"></menu></abbr><pre id="syoyg"></pre>

<abbr id="syoyg"><menu id="syoyg"></menu></abbr>