成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大模型高效開發的秘密武器——大模型低參微調套件MindSpore PET篇

開發 開發工具
大模型具備更強泛化能力,在各垂直領域落地時,只需要進行參數微調,就可以適配多個場景。因此,發展大模型已成為產學研各界共識。

人工智能進入“大模型時代”。

大模型具備更強泛化能力,在各垂直領域落地時,只需要進行參數微調,就可以適配多個場景。因此,發展大模型已成為產學研各界共識。

在大模型開發方面,昇騰推出了大模型開發使能平臺,基于昇思MindSpore構建了支撐大模型開發的全流程大模型使能套件,包括TransFormers大模型套件MindSpore TransFormers、以文生圖大模型套件MindSpore Diffusion、人類反饋強化學習套件MindSpore RLHF、大模型低參微調套件MindSpore PET,支撐大模型從預訓練、微調、壓縮、推理及服務化部署。

本期,我們將開啟“大模型高效開發的秘密武器”系列之首篇,為大家介紹大模型低參微調套件——MindSpore PET。

MindSpore PET(MindSpore Parameter-Efficient Tuning)是基于昇思MindSpore AI融合框架開發的大模型低參微調套件。當前該套件提供6種算法,包含5種經典的低參微調算法LoRA、Prefix-Tuning、Adapter、LowRankAdapter、BitFit,以及1種用于下游任務精度提升的微調算法R_Drop。低參微調算法只需微調極少量的參數,即可在保持全參微調精度的情況下,大大節約計算和存儲內存,減少微調訓練的時間;精度提升的微調算法在幾乎不增加計算內存及時間情況下,增加模型隨機性,防止模型過擬合從而提高模型的正確率。

套件為所有算法提供了API調用接口及使用案例,實現開箱即用,并為低參微調算法提供了只保存極少的可學習參數的接口,使得生成的ckpt文件非常小。

開源倉地址:https://github.com/mindspore-lab/MindPet

圖片2.jpg

LoRA: Low-Rank Adaptation of Large Language Models,是微軟提出的一種針對大語言模型的低參微調算法。LoRA假設在適配下游任務時,大模型的全連接層存在一個低內在秩(low intrinsic rank),即包含大量冗余信息。因此提出將可訓練的秩分解矩陣注入Transformer架構的全連接層,并凍結原始預訓練模型的權重,從而可大大減少參與訓練的參數量。

圖片3.png

以悟空畫畫為例,悟空畫畫模型是基于擴散模型的中文文生圖大模型。雖然有強大的能力,但模型網絡規模巨大,約9億參數量,適配下游任務時訓練時間長,計算和存儲內存開銷大。

經分析,悟空畫畫中使用CLIP模型將人類語言轉換成機器能理解的數學向量,并通過 U-Net 模型預測噪聲。這兩種模型的Attention結構都包含全連接層,適配下游任務時可能含有大量冗余信息。

圖片4.png

因此,我們分別在 U-Net的交叉注意力層q、k、v、output四個模塊上,注入了LoRA模塊,發現效果異常好。

如下圖所示,適配LoRA后即使僅訓練0.07%參數,也可以生成高質量的圖像!

圖片5.png

同時,相比全參微調,應用LoRA算法,訓練性能也得到大幅提升:原本端到端全參微調需17小時,適配后僅需9小時,節約近50%時間; 計算內存節約40%,可繼續增大一倍batch_size,速度更快;最終保存的ckpt大小才3.06MB,不再需要用4個GB保存所有參數。

圖片6.png

這說明當有n個下游任務時,僅需保存n x 3.06MB,避免了n x 4GB的“龐然大物”。而且,我們還做了令人振奮的實驗。如果用戶訓練了多種風格的模型,只需0.5s就可以切換風格,真正的無縫切換“畢加索”和“新海誠”!

原因在于MindSpore框架的靜態圖特性,只需要在第一次正向訓練時編圖,后續即使加載其它LoRA-ckpt更新參數,也無需重新編圖。

為大模型減輕負擔的LoRA算法本身用起來也很輕松,端到端僅需簡單五步就可以完成適配。

第一步:將模型CrossAttention結構中qkvo的Dense層替換成LoRADense:

圖片7.png

第二步:在訓練腳本中調用凍結方法,僅訓練新增的lora模塊:

圖片8.png

第三步:在訓練腳本中將保存ckpt的ModelCheckpoint替換為TrainableParamsCheckPoint,僅保存需要更新的參數:

圖片9.png

第四步:根據訓練目標調整學習率、batch_size等參數:

圖片10.png

第五步:訓練完成后,在評估腳本中分別加載預訓練ckpt和微調后生成的ckpt:

圖片11.png

目前已經開源所有代碼,詳細的接口和用例介紹如下:https://github.com/mindspore-lab/MindPet/blob/master/doc/TK_DeltaAlgorithm_README.md

需要注意的是相比全參微調,適配LoRA后一般要設置更大的學習率。如適配悟空畫畫時,我們就將學習率從1e-5增大到1e-4。

MindSpore PET - Prefix-Tuning

Prefix-Tuning: Optimizing Continuous Prompts for Generation,也是一種針對大語言模型的低參微調算法。研究人員提出,使用連續的向量而不是離散的詞匯來構建前綴模板,即在輸入前加入連續的token embedding,可以增加query和key的相關性。因此,Prefix-Tuning通過在每個multi-head attention的 key 矩陣和 value 矩陣前注入可訓練的prefix向量k,v,并凍結原始網絡參數,來大幅提升生成類任務的性能。

Prefix-Tuning在GPT-2和盤古Alpha大模型上都有很好的效果。與全參微調相比,在保持原有精度的前提下,使用Prefix-Tuning訓練盤古Alpha僅需5.5%的參數量,節約了65%以上的計算內存,并將一個迭代的耗時縮短到一半。

圖片12.png

MindSpore PET - Rdrop

R-Drop: Regularized Dropout for Neural Networks,是一種用于提升精度的微調算法,主要通過簡單的“兩次Dropout”來構造正樣本進行對比學習,增加模型隨機性。具體是在模型加載完一個batch的數據集之后,復制一份該數據,并同時輸入到模型中,然后分別計算損失函數,并將結果相加得到最終的loss值。盡管邏輯非常簡單,卻能很好的防止模型過擬合,進一步提高模型的正確率。經在Bert上多個下游任務上驗證,幾乎保持同樣的內存和時間開銷,就能提升2.6個點的精度。

圖片13.png

大模型開發到部署是一個高門檻、復雜的過程,大模型使能套件將幫助開發者,讓大模型更易開發、易適配、易部署。

想了解更多關于TransFormers大模型套件MindSpore TransFormers、以文生圖大模型套件MindSpore Diffusion、人類反饋強化學習套件MindSpore RLHF的相關信息,請關注昇思MindSpore公眾號,我們將持續為大家帶來人工智能領域技術干貨和活動消息。

責任編輯:張誠
相關推薦

2025-04-25 10:03:12

2023-06-07 08:22:59

LLM微調技術

2025-03-20 07:13:25

2013-10-16 09:28:14

亞馬遜AWSSDN

2013-10-16 09:33:36

亞馬遜AWSSDN

2014-12-16 18:56:05

聯想

2024-01-18 15:38:17

語言模型大型語言模型

2011-08-11 17:05:26

2014-01-07 10:46:39

2024-07-11 08:34:48

2023-02-13 08:00:00

深度學習數據算法

2025-05-15 00:01:00

2024-09-09 07:46:16

2025-04-10 07:59:51

2022-02-11 10:47:17

CIOIT團隊企業

2024-10-25 19:32:58

ChatGPT

2020-05-11 13:42:54

Python代碼開發

2025-02-03 10:04:47

擴散模型數據分布

2023-05-08 14:54:00

AI任務HuggingGPT

2019-11-27 10:40:34

數據工具CIO
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 一级片免费网站 | 精品一区二区三区日本 | 欧美精品片 | 美女一级a毛片免费观看97 | 色婷婷av久久久久久久 | 成在线人视频免费视频 | 在线婷婷| 日本三级在线视频 | 精品1区2区 | 国产精品久久国产精品久久 | 欧美一级淫片007 | 国产精品视频一二三区 | 亚洲精品大全 | 久久www免费人成看片高清 | 免费久久久久久 | 高清视频一区二区三区 | 亚洲综合久久久 | 日韩在线观看中文字幕 | 欧美在线观看一区 | 亚洲欧美一区二区三区国产精品 | 91.xxx.高清在线 | 狠狠伊人| 91亚洲国产成人精品一区二三 | 久久精品国产一区二区 | 91美女在线观看 | 欧美综合国产精品久久丁香 | 国产成人在线一区二区 | 色.com| 五月婷六月丁香 | 亚洲三级在线观看 | 日韩精品在线网站 | 91麻豆精品国产91久久久久久 | 精品日韩一区二区 | 久久国产精品一区二区 | 欧美精品久久久久久久久久 | 91影院在线观看 | 国产精品一区二区久久 | 亚洲视频 欧美视频 | 欧美精品久久 | 成人免费毛片片v | 成人一区二区在线 |