成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

僅微調0.02%參數,性能接近全量微調!上交大推出高效微調統一新范式

人工智能 新聞
盡管近年來高效微調領域發展迅速,涌現了多種方法,但不同PEFT方法背后的數學基礎幾乎沒有得到深入研究。

Scaling Laws當道,但隨著大模型應用的發展,基礎模型不斷擴大的參數也成了令開發者們頭疼的問題。

為了減輕訓練負擔,Adapter、Prompt-Tuning以及LoRA等高效微調(Parameter Efficient Fine-Tuning, PEFT)算法越來越受到大家伙的青睞。

那么,問題來了——

盡管近年來高效微調領域發展迅速,涌現了多種方法,但不同PEFT方法背后的數學基礎幾乎沒有得到深入研究。

此外,不同PEFT方法之間的性能差異及其原因尚未系統地探討。這種理論深度的缺乏限制了研究者對這些方法潛在優勢和局限性的理解,阻礙了它們在實際應用中的優化和創新。

為了解決這一問題,來自上海交通大學的研究者們在對各種PEFT方法進行全面數學分析后,提出了一種新的框架——子空間微調,旨在將所有已知的PEFT方法統一在一個理論下,

圖片

具體來說,子空間微調方法主要集中于調整原始參數的子空間,涉及子空間的重構和擴展。研究者深入探討了不同方法如何操作子空間,并從分解理論的角度闡明了每種方法的數學原理。此外,研究者分析了為什么這些方法會導致性能差異,提供了理解不同PEFT策略內在動態的全面理論基礎。

他們基于此提出了兩種新的PEFT方法,新方法在僅微調0.02%參數的情況下,性能接近于全面微調

研究者還介紹了一個有效的框架,在不引入額外訓練參數的情況下,提升了LoRA等方法的性能。通過在三種不同模型上測試超過十種方法,廣泛的實驗驗證了其理論的穩健性,同時展示了提出的方法和框架的有效性。

圖片

來看論文細節。

子空間微調理論

考慮任何給定主干網絡層的凍結權重矩陣圖片,其中n≤m,并用權重矩陣圖片的性能圖片來量化模型的性能,值越高表示性能越好。

假設存在最優權重矩陣圖片 ,且圖片對所有圖片成立。PEFT的目標公式化為:

圖片

其中圖片衡量兩個矩陣之間的差異。函數圖片被視為增量調優,表示對矩陣圖片的每個元素的修改,但這種表征過于籠統。

從分解理論的角度看,調整矩陣涉及修改其對應的子空間,因此,所有PEFT方法可視為子空間微調。

如此,優化的目標是找到圖片圖片基所生成的子空間內的最大投影,然后將圖片與其對齊。

有兩種方法實現這一目標:通過調整圖片來逼近圖片,或操作圖片的子空間以接近或包含圖片

研究者將函數圖片分配給兩個主要角色:直接重構對應圖片的子空間,以更好地對齊圖片,或引入一個新子空間并與原始子空間結合。這些過程數學表示為:

圖片

其中,圖片概括了圖片的子空間重構過程,圖片描述了子空間的聯合。研究者將這些操作分別稱為“子空間重構”和“子空間擴展”,并將現有方法分類為三類:

  1. 基于子空間重構的方法,將復雜空間分解為易理解的子空間,并調整這些派生子空間的基
  2. 基于子空間擴展的方法,引入一個新子空間,在新子空間和原始權重矩陣圖片對應的子空間基所生成的空間內找到最優權重圖片的最大投影;
  3. 基于子空間組合的方法,同時采用上述子空間調整。

圖片

子空間重構

基于先前概述的框架,子空間重構方法首先將圖片的空間分割為可解釋的子空間,然后細化這些子空間以提高模型效率。許多PEFT策略集中于直接重構與原始權重矩陣相關的子空間,著名例子包括SAM-PARSER、Diff Pruning、(IA)3、BitFit、Prefix-tuning和Prompt-tuning等。

研究者從奇異值分解(SVD)開始探索,原始權重矩陣圖片被分解為正交子空間,涵蓋了原始矩陣空間的全部。分解表示為圖片,這種分解將圖片分成左奇異向量圖片圖片列空間的正交基)、奇異值圖片(調整維度和縮放)和右奇異向量圖片圖片行空間的正交基)。通過調整分解獲得的子空間,可以重構原始空間,分為三種模式:

  1. 奇異值調整:調整圖片中的奇異值,修改每個主成分的權重,而不影響子空間方向。
  2. 簡單奇異向量調整:通過縮放生成的子空間來調整圖片 圖片中的奇異向量,保留方向特性,同時調整幅度。
  3. 復雜奇異向量調整:對奇異向量進行更復雜的變換,重新定向或重塑子空間,全面調整矩陣結構。

圖片


基于這一理論,研究者提出了兩種新的微調方法:SSL(Scaling the Subspace of the Left singular vectors)和SSB(Scaling the Subspace of Both left and right singular vectors)

從下圖中可以看出,SSL最少只需要微調0.02%的參數,SSB最少只需要微調0.06%的參數,就能實現全量微調99%的性能

圖片

關于每種模式的具體操作、每種方法的具體內容、其背后的數學原理,以及研究者如何基于這一理論提出兩種新方法的詳細信息,請參閱原論文。

子空間擴展

基于擴展的方法引入新子空間,結合該新子空間和原始權重矩陣圖片的基生成擴展空間。

這些方法旨在找到最優權重圖片在新空間內的最接近投影,通過引入額外的權重矩陣來擴大原始子空間的基以覆蓋更大維度區域。通常,這些方法的轉換函數定義為圖片,其中s代表縮放因子,圖片對應于新子空間,也稱為附加項。

考慮權重矩陣圖片,假設n≤m。理想情況下,有圖片,即圖片圖片占據相同的行和列空間,使它們定位在同一超平面內。

如果圖片的秩為n,其列空間的維度等于n,生成圖片子空間。若圖片的秩小于n,它只能在圖片內生成一個子空間。假設圖片圖片的列空間基可以生成整個圖片空間,在最優情況下,圖片的列基向量應補充圖片的列基,意味著圖片的列空間代表這些空間的直和。

一些研究表明,最優權重圖片會放大原始權重矩陣中某些特定任務的方向,這些方向對于預訓練并不關鍵。此外,最優權重還會調整圖片的主要方向。這些見解表明圖片可能與圖片 的子空間共享大量共同基。因此,圖片可能只需考慮圖片中缺少但圖片中存在的一小部分基,使圖片成為低秩矩陣。

實證研究表明,預訓練模型的全參數微調通常可重新參數化為在低維子空間內優化,表明最優權重在這個受限的低秩子空間內變化。圖片的低秩特性突出了基于擴展方法的參數效率基礎。

另一個關鍵方面是縮放因子s。基于擴展的方法目標是確定圖片圖片圖片形成的超平面內的最大投影,確保圖片盡可能與圖片方向對齊。給定固定的圖片圖片,只有一個s值能使 \圖片 的方向與圖片方向對齊,因此s值對性能的影響可能非常顯著。

在參數高效微調中,有兩大系列基于擴展的方法。第一系列是LoRA衍生,包括LoRA、AdaLoRA、TriLoRA、FLoRA、VeRA等。第二系列是適配器衍生,包括Adapter(H),Adapter(P),Parallel Adapter等。

在此基礎之上,研究者提出了MPC框架,以進一步提升現有算法的性能。

從下圖中可以看出,在不引入額外參數的情況下,MPC框架顯著增強了各種PEFT方法的性能。

另外,MPC可以幫助PEFT方法實現更穩定的訓練。與不使用MPC的方法相比,結合MPC的方法通常表現出更小的標準偏差。

圖片

關于這些方法的具體分析,LoRA和Adapter系列算法性能差異的原因,以及MPC框架的詳細設計思路,請參閱原論文。

子空間組合

基于組合的方法同時執行子空間重構和擴展,結合了這兩種方法的原理。

此外,對于某些方法,它們既可以分類為基于重構的方法,也可以分類為基于擴展的方法,研究者也將它們分類為基于組合的方法。研究者分析介紹幾種代表性的基于組合的方法,如DoRA,Spectral Adapter和SVDiff等。

關于這些方法的具體細節請參閱原論文。

論文:https://arxiv.org/pdf/2407.05417
代碼:https://github.com/Chongjie-Si/Subspace-Tuning

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-07-03 12:12:33

訓練模型

2024-09-18 11:50:00

框架訓練AI

2023-10-07 10:41:54

語言模型微調BitFit

2024-01-18 15:38:17

語言模型大型語言模型

2025-05-08 05:00:00

2025-06-26 09:06:59

2013-11-21 11:03:29

Nginx性能優化

2024-12-10 09:07:17

2024-08-16 11:49:56

2025-02-24 14:15:00

模型訓練AI

2024-04-15 12:50:00

大型語言模型ReFT

2024-04-19 12:50:58

人工智能OpenAI

2025-05-28 11:46:18

開源模型數據

2024-11-11 13:33:28

2024-09-26 10:42:20

2023-06-07 08:22:59

LLM微調技術

2024-06-06 08:25:30

2025-04-26 16:44:45

2025-05-28 11:42:14

模型框架AI

2025-06-25 08:53:00

模型AI強化學習
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 99pao成人国产永久免费视频 | 国产一级在线 | 久久男人天堂 | 放个毛片看看 | 久久午夜国产精品www忘忧草 | 久久久久久免费精品一区二区三区 | 久久在视频| 91视频中文 | 精品日韩在线 | 影视一区 | 黄色av网站在线观看 | 一级片av| 日本手机看片 | 国产一区二区三区在线看 | 欧美精品在线观看 | 欧美视频在线看 | 中文字幕日本一区二区 | 久久久久久久97 | 欧美一级黄色网 | h视频在线观看免费 | 6080亚洲精品一区二区 | 国产一级一片免费播放 | 久久久爽爽爽美女图片 | 国产精品久久久久久久久免费高清 | 日本久久精品 | 91精品国产91久久久久久吃药 | 久久综合久 | 欧美日韩国产在线观看 | 国产精品久久亚洲7777 | 日韩精品视频在线观看一区二区三区 | 久久久www成人免费精品 | 午夜精品久久久久久久99黑人 | 欧美黑人体内she精在线观看 | 中文字幕在线一区二区三区 | 在线欧美小视频 | 日本不卡高清视频 | 国产 欧美 日韩 一区 | 国产视频中文字幕 | 超碰人人人 | 久久免费高清 | www.99re |