成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<center id="cwsms"><wbr id="cwsms"></wbr></center>

<noscript id="cwsms"><strong id="cwsms"></strong></noscript><center id="cwsms"><tr id="cwsms"></tr></center>

<noscript id="cwsms"></noscript>

<samp id="cwsms"><small id="cwsms"></small></samp>

<samp id="cwsms"></samp>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

GoRA: 基于梯度驅(qū)動(dòng)的自適應(yīng)低秩微調(diào)方法

發(fā)布于 2025-2-20 10:41

瀏覽

0收藏

研究背景與動(dòng)機(jī)

本文提出了一種新的低秩適應(yīng)(LoRA)變體 - GoRA(Gradient-driven Adaptive Low Rank Adaptation)，通過(guò)梯度信息來(lái)自適應(yīng)地分配秩和初始化低秩適配器的權(quán)重。該方法在保持LoRA高可用性和效率的同時(shí)顯著提升了模型性能。

現(xiàn)有問(wèn)題

秩的選擇問(wèn)題：LoRA的性能很大程度上取決于秩的選擇，但增加秩會(huì)導(dǎo)致內(nèi)存使用量上升。
初始化策略局限：現(xiàn)有的非零初始化方法要么需要重置全部權(quán)重，要么需要保存額外的初始化結(jié)果。
可用性與效率的權(quán)衡：已有的LoRA變體在提升性能的同時(shí)往往會(huì)犧牲可用性或效率。

研究意義

提出一種新的方法來(lái)解決上述問(wèn)題，在不影響LoRA原有優(yōu)勢(shì)的前提下提升其性能，對(duì)于大語(yǔ)言模型的高效微調(diào)具有重要意義。

技術(shù)創(chuàng)新

1. 梯度視角的LoRA重新解釋

將LoRA視為梯度壓縮器，通過(guò)分析其更新形式發(fā)現(xiàn)：

LoRA-FA凍結(jié)隨機(jī)初始化的矩陣A，僅訓(xùn)練矩陣B時(shí)，可以看作是一個(gè)梯度累積和壓縮的過(guò)程
壓縮矩陣為隨機(jī)初始化的A
這種理解為后續(xù)的改進(jìn)提供了理論基礎(chǔ)

2. GoRA的核心創(chuàng)新

GoRA: 基于梯度驅(qū)動(dòng)的自適應(yīng)低秩微調(diào)方法-AI.x社區(qū)

動(dòng)態(tài)秩分配策略：

a.基于權(quán)重對(duì)損失的敏感度計(jì)算重要性

b.在訓(xùn)練開(kāi)始前完成秩分配

c.保持與LoRA相近的可訓(xùn)練參數(shù)數(shù)量

d.維持與LoRA一致的形式以確保兼容性

初始化策略優(yōu)化：
保持矩陣A的正態(tài)分布初始化
使用偽逆壓縮梯度初始化矩陣B
引入縮放因子ξ來(lái)確保訓(xùn)練穩(wěn)定性

3. 算法流程

計(jì)算并保存權(quán)重W在訓(xùn)練樣本子集上的完整梯度G
基于梯度信息評(píng)估W的重要性
根據(jù)歸一化的重要性分配新的可訓(xùn)練參數(shù)和對(duì)應(yīng)的低秩適配器秩
使用Moore-Penrose逆矩陣對(duì)B進(jìn)行最優(yōu)初始化

實(shí)驗(yàn)評(píng)估

1. 自然語(yǔ)言理解任務(wù)

數(shù)據(jù)集：GLUE基準(zhǔn)測(cè)試中的5個(gè)子任務(wù)(MNLI、SST-2、CoLA、QNLI、MRPC)
模型：T5-Base
結(jié)果：

在4個(gè)數(shù)據(jù)集上取得最佳性能

平均分87.96，超過(guò)所有基線方法

甚至略微超過(guò)全量微調(diào)(87.91)

2. 自然語(yǔ)言生成任務(wù)

評(píng)估任務(wù)：

數(shù)學(xué)能力：GSM8K

編碼能力：HumanEval

對(duì)話能力：MTBench

模型：Llama-3.1-8B-Base
結(jié)果：
GSM8K：得分72.91，超過(guò)LoRA-GA 1.52分
HumanEval：得分48.98，超過(guò)RSLoRA 3.20分
高秩設(shè)置(Rank128)下性能優(yōu)于全量微調(diào)

GoRA: 基于梯度驅(qū)動(dòng)的自適應(yīng)低秩微調(diào)方法-AI.x社區(qū)

技術(shù)細(xì)節(jié)分析

1. 秩分配策略的影響

更寬的秩分配范圍能帶來(lái)更好的性能
wv層獲得最多的秩分配，wq層獲得最少
高秩權(quán)重在合并后獲得更大的更新

2. 初始化策略的效果

縮放因子γ對(duì)模型效果影響顯著
在HumanEval數(shù)據(jù)集上，γ=5e-2時(shí)性能最佳
在GSM8k數(shù)據(jù)集上，γ=8e-2時(shí)性能最佳

3. 計(jì)算開(kāi)銷

可訓(xùn)練參數(shù)僅增加2.6%
內(nèi)存使用與LoRA基本相同
初始化時(shí)間(4分鐘)相對(duì)訓(xùn)練時(shí)間(5小時(shí)48分鐘)可忽略

局限性與未來(lái)工作

局限性

尚未在更大規(guī)模模型和更大數(shù)據(jù)集上進(jìn)行驗(yàn)證
主要聚焦于語(yǔ)言模型，其他模態(tài)的適用性有待驗(yàn)證
矩陣A的初始化方法仍有優(yōu)化空間

未來(lái)工作方向

擴(kuò)展到更大規(guī)模模型如Llama-3.1-70B
探索在視覺(jué)語(yǔ)言模型等其他類型模型上的應(yīng)用
研究更優(yōu)的矩陣A初始化策略
與其他LoRA變體(如DoRA)的結(jié)合

總結(jié)

GoRA通過(guò)梯度信息驅(qū)動(dòng)的動(dòng)態(tài)秩分配和初始化策略，在保持LoRA高效率和可用性的同時(shí)顯著提升了性能。其創(chuàng)新點(diǎn)主要體現(xiàn)在：

從梯度壓縮的角度重新詮釋LoRA，提供了新的理論視角
提出基于梯度信息的動(dòng)態(tài)秩分配策略
設(shè)計(jì)了新的初始化方法，確保訓(xùn)練穩(wěn)定性

該方法在多個(gè)任務(wù)上展現(xiàn)出優(yōu)秀的性能，某些場(chǎng)景下甚至超過(guò)全量微調(diào)，為大語(yǔ)言模型的高效微調(diào)提供了新的解決方案。

paper:https://arxiv.org/abs/2502.12171

本文轉(zhuǎn)載自 ??頓數(shù)AI??，作者：小頌

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

大模型提示學(xué)習(xí)樣本量有玄機(jī)，自適應(yīng)調(diào)節(jié)方法好

pangguiyu ? 3563瀏覽 ? 0回復(fù)
一文詳解視覺(jué)Transformer模型壓縮和加速策略(量化/低秩近似/蒸餾/剪枝)

angel ? 5619瀏覽 ? 0回復(fù)
簡(jiǎn)化大模型微調(diào)門(mén)檻：運(yùn)用Ludwig低代碼框架的平臺(tái)技術(shù)實(shí)戰(zhàn)

AIGC觀察者 ? 3412瀏覽 ? 0回復(fù)
ECCV 2024 | 探索離散Token視覺(jué)生成中的自適應(yīng)推理策略

輕薄滴假象 ? 2262瀏覽 ? 0回復(fù)
大模型微調(diào)方法之QLoRA

shizhi02 ? 2704瀏覽 ? 0回復(fù)
蘋(píng)果發(fā)布高效雙EMA梯度優(yōu)化方法，適配Transformer、Mamba模型

Aceryt ? 2167瀏覽 ? 0回復(fù)
AI驅(qū)動(dòng)的基于意圖的網(wǎng)絡(luò)（IBN）：人工智能助力網(wǎng)絡(luò)管理的未來(lái)

51CTO內(nèi)容精選 ? 2971瀏覽 ? 0回復(fù)
關(guān)于自適應(yīng)模態(tài)分解方法

步驚云_32 ? 2828瀏覽 ? 0回復(fù)
NeurIPS'24 基于自適應(yīng)多尺度超圖Transfromer的時(shí)間序列預(yù)測(cè)方法

海因斯DK ? 3851瀏覽 ? 0回復(fù)
低資源場(chǎng)景下Text2SQL方法

大模型自然語(yǔ)言處理 ? 2309瀏覽 ? 0回復(fù)
西湖大學(xué)等提出TPDM：自適應(yīng)噪聲調(diào)度

angel ? 2522瀏覽 ? 0回復(fù)
基于 LlamaFactory 微調(diào)大模型的實(shí)體識(shí)別的評(píng)估實(shí)現(xiàn)

AI悠閑區(qū) ? 2584瀏覽 ? 0回復(fù)
深度學(xué)習(xí)訓(xùn)練崩潰的真兇：梯度消失與梯度爆炸背后的秘密

人工智能訓(xùn)練營(yíng) ? 2934瀏覽 ? 0回復(fù)
分布式訓(xùn)練通信優(yōu)化，重疊通信，參數(shù)子集同步，低精度外梯度量化

AI研究前瞻 ? 2507瀏覽 ? 0回復(fù)
DeepSeek核心架構(gòu)-MLA：剖析低秩聯(lián)合壓縮優(yōu)化KV緩存、提升推理效率的技術(shù)細(xì)節(jié)

南夏的算法驛站 ? 4766瀏覽 ? 0回復(fù)
COSMOS：結(jié)合特征子空間分解的混合自適應(yīng)優(yōu)化器用于大型語(yǔ)言模型的內(nèi)存高效訓(xùn)練

頓數(shù)AI ? 2532瀏覽 ? 0回復(fù)
AdaptiVocab：使用輕量級(jí)框架自適應(yīng)降低LLM Token數(shù)！

石映飛云 ? 864瀏覽 ? 0回復(fù)
推理模型的必經(jīng)之路-自適應(yīng)推理

NLP工作站 ? 632瀏覽 ? 0回復(fù)
我們一起聊聊變擴(kuò)散局部線性調(diào)頻自適應(yīng)窗時(shí)頻分析方法（MATLAB）

步驚云_32 ? 702瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

循環(huán)LLM的突破：基于塊的推理如何解決記憶溢出問(wèn)題 8天前發(fā)布
知識(shí)圖譜與LLM接口優(yōu)化：突破復(fù)雜推理的性能瓶頸 2025-06-09 00:48:48發(fā)布

熱門(mén)推薦

知識(shí)圖譜與LLM接口優(yōu)化：突破復(fù)雜推理的性能瓶頸 0回復(fù)

AI Agents開(kāi)源工具棧全解析~ 1回復(fù)

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒(méi)問(wèn)題 0回復(fù)

Deepseek R1 0528實(shí)測(cè)：性能直逼頂尖，普通電腦本地運(yùn)行全攻略 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實(shí)測(cè)：真·超DS！ 1回復(fù)

上一篇：基于文本的可解釋AI局部代理模型穩(wěn)定性估計(jì)分析

下一篇： X-IL：系統(tǒng)化探索模仿學(xué)習(xí)策略的設(shè)計(jì)空間

社區(qū)精華內(nèi)容

目錄

主站蜘蛛池模板：中文字幕1区 | 亚洲精品成人 | 久久久久久成人 | 天天欧美| 亚欧洲精品在线视频免费观看 | 欧美日韩中文字幕在线 | 欧美三区在线观看 | 伦理二区| 在线视频一区二区三区 | 国产午夜在线观看 | 亚洲精品一区国语对白 | 日韩中文字幕在线观看 | 日韩精品在线看 | 尤物在线精品视频 | 欧美成人手机视频 | 一区二区三区在线播放视频 | 老司机午夜性大片 | 蜜桃在线播放 | 一区二区三区视频免费看 | 亚洲综合成人网 | 中文字幕一区二区三区日韩精品 | 一区二区三区四区不卡 | 天天干b| 日本精品一区二区三区在线观看视频 | 亚洲欧美第一视频 | 亚洲二区视频 | 欧美中文一区 | 国产综合在线视频 | 久久久久久99| 日本精品视频 | 一区二区三区国产好 | 四虎在线观看 | 日操操夜操操 | 日日天天 | v亚洲 | 国产91丝袜在线18 | 日韩一区二区三区精品 | 亚洲啪啪 | 日韩av一区二区在线观看 | 亚洲精品成人免费 | 精品国产乱码一区二区三区a |

<option id="scoyy"><abbr id="scoyy"></abbr></option>

<center id="scoyy"></center>