成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<var id="oucyy"></var>

<u id="oucyy"></u>

<button id="oucyy"><form id="oucyy"></form></button>

<button id="oucyy"><option id="oucyy"></option></button>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)

發(fā)布于 2024-9-19 12:54

瀏覽

0收藏

修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)-AI.x社區(qū)

文章鏈接：https://arxiv.org/pdf/2409.06633
項目鏈接：https://sjtuplayer.github.io/projects/SaRA/

1.引言

SaRA是一種針對預訓練擴散模型的高效微調(diào)方法。通過微調(diào)預訓練擴散模型中的無效參數(shù)，賦予模型對下游任務(wù)的處理能力。SaRA能夠顯著節(jié)省計算顯存開銷與代碼復雜度，僅修改一行訓練代碼即可實現(xiàn)微調(diào)過程。該方法的核心創(chuàng)新在于：

參數(shù)重要性分析：SaRA首先對預訓練模型中的參數(shù)重要性進行分析，發(fā)現(xiàn)預訓練擴散模型中絕對值最小的10%至20%的參數(shù)在生成過程中的作用微乎其微。并且這些參數(shù)的無效性并非模型固有屬性，而是由于訓練過程中的不穩(wěn)定性導致。
稀疏低秩訓練：基于上述發(fā)現(xiàn)，SaRA提出利用這些暫時無效的參數(shù)，通過優(yōu)化稀疏權(quán)重矩陣來學習特定任務(wù)的知識。為了避免過擬合，SaRA采用了基于核范數(shù)的低秩稀疏訓練方案，有效約束了學習過程中的參數(shù)秩。
漸進式參數(shù)調(diào)整策略：SaRA設(shè)計了一種參數(shù)重調(diào)整策略，通過在微調(diào)過程中重定向可訓練參數(shù)，確保幾乎所有參數(shù)都能有效地貢獻于新任務(wù)的學習。
非結(jié)構(gòu)化反向傳播策略：SaRA提出了一種新穎的反向傳播策略，顯著降低了微調(diào)過程中的內(nèi)存成本。

SaRA在多個下游任務(wù)上進行了廣泛的實驗驗證，包括基模型能力提升、下游數(shù)據(jù)微調(diào)、圖像定制化、可控視頻生成等。實驗結(jié)果表明SaRA不僅能夠提升基礎(chǔ)模型在原始任務(wù)的生成能力，在下游任務(wù)中，能兼顧下游任務(wù)的學習以及預訓練先驗的維護，實現(xiàn)優(yōu)越的模型微調(diào)效果。

2. 參數(shù)重要性分析

2.1 預訓練模型中的無效參數(shù)

修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)-AI.x社區(qū)

修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)-AI.x社區(qū)

圖 1：Stable Diffusion預訓練模型參數(shù)分布與小參數(shù)對生成結(jié)果的影響

2.2 無效參數(shù)的潛在有效性

2.1中導致無效參數(shù)的原因可能有兩個：一是由于模型結(jié)構(gòu)設(shè)計的原因，這些參數(shù)天生就是冗余、無效的參數(shù)，因此無法在訓練過程中起到作用，另外一個原因則可能是由于模型訓練過程中的隨機性，導致這些參數(shù)恰好在訓練結(jié)束的時候停留在0附近。因此，作者進一步對參數(shù)無效的原因展開研究。選取了Stable Diffusion在FFHQ的預訓練模型，標記了初始權(quán)重最小的1%參數(shù)，將該模型繼續(xù)在FFHQ上訓練，并在訓練過程中實時跟蹤這1%參數(shù)的變化，結(jié)果如圖 2所示，可見，隨著訓練的進行，初始的小參數(shù)（藍色線條）逐漸跳出了1%的閾值，而初始大于1%閾值的參數(shù)，大部分跌入了1%以內(nèi)，并且小于該閾值的參數(shù)總量始終維持在1%左右，證明了在訓練過程中，所有參數(shù)都以一定的概率跳出或者跌入1%閾值中，說明初始的小參數(shù)是由訓練過程的隨機性導致的，因此，可以在微調(diào)過程中利用這些暫時無效的參數(shù)，賦予模型針對下游任務(wù)的生成能力。

修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)-AI.x社區(qū)

圖 2：訓練過程中權(quán)重絕對值小于初始1%閾值θ_t的參數(shù)分布變化

3. 方法介紹

修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)-AI.x社區(qū)

3.1 稀疏矩陣訓練

修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)-AI.x社區(qū)

3.2 基于核范數(shù)的低秩約束

修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)-AI.x社區(qū)

3.3 漸進式參數(shù)調(diào)整

在模型的微調(diào)過程中，由于訓練的隨機性，仍然會存在部分參數(shù)停留在閾值以下，尤其是微調(diào)過程的總輪次往往較少，導致最終存在一部分的參數(shù)仍然無效。如圖 2 所示，初始的小參數(shù)在訓練初期會快速跳出閾值，而后期的趨勢逐漸放緩，當微調(diào)輪次較少時，可訓練參數(shù)中可能存在15%的參數(shù)仍然無效。因此，SaRA提出漸進式的參數(shù)調(diào)整策略，在微調(diào)的前半階段，首先對初始的無效參數(shù)進行訓練，使得大部分的無效參數(shù)跳出閾值，而在后半階段，再次對剩余的無效參數(shù)進行訓練，使其快速跳出閾值。通過這種分階段的漸進式訓練策略，SaRA可以更有效地利用這些無效參數(shù)，提高模型在新任務(wù)上的性能。

3.4 非結(jié)構(gòu)化反向傳播策略

修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)-AI.x社區(qū)

修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)-AI.x社區(qū)

圖3：非結(jié)構(gòu)化梯度反向傳播

4.實驗效果

為了驗證方法的有效性，SaRA在多個主流與下游的任務(wù)上進行了驗證，包含基模型提升、下游數(shù)據(jù)集微調(diào)、圖像定制化與可控視頻生成。

4.1 基模型提升

SaRA主要致力于將預訓練模型中的無效參數(shù)利用起來，賦予模型更強大的生成能力，這與一般微調(diào)方法僅針對下游任務(wù)設(shè)計的理念不盡相同。因此，SaRA可以用來提升預訓練模型在原本任務(wù)上的生成能力。實驗選取了在ImageNet、FFHQ、CelebA-HQ上預訓練的Stable Diffusion，利用SaRA在相應(yīng)數(shù)據(jù)集對模型進行進一步的微調(diào)，以完全利用模型中的無效參數(shù)，結(jié)果如圖4所示，可以看出，SaRA能夠穩(wěn)定地提升基模型的生成能力（降低約5%的FID）。

修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)-AI.x社區(qū)

圖4：基模型在原始任務(wù)上的微調(diào)

4.2下游數(shù)據(jù)集微調(diào)

在下游數(shù)據(jù)集微調(diào)實驗中，將SaRA應(yīng)用于多個不同的數(shù)據(jù)集，并在不同StableDiffusion版本（1.5,2.0,3.0）與參數(shù)規(guī)模（50M，20M，5M）下進行了訓練。數(shù)據(jù)集包括BarbieCore, Cyberpunk, Elementfire, Expedition, Hornify五個風格，結(jié)果如圖5所示，可見SaRA取得了學習到了最豐富的數(shù)據(jù)特征，同時能夠保持語義與文本的一致性。此外，實驗還計算了生成數(shù)據(jù)的FID，與文本的CLIP Score，以及一個歸一化指標VLHI同時衡量FID與CLIP Score，定量結(jié)果如表1所示，可見，SaRA在不同版本的Stable Diffusion以及不同的參數(shù)量下，均取得了最好的表現(xiàn)。

修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)-AI.x社區(qū)

圖5：不同微調(diào)方法在下游數(shù)據(jù)集微調(diào)的表現(xiàn)。

修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)-AI.x社區(qū)

表1：不同微調(diào)方法在下游數(shù)據(jù)集微調(diào)的定量表現(xiàn)。

4.3 圖像定制任務(wù)

圖像定制化通過從少量幾張圖像中學習到共有的對象特征，然后將該對象生成到新的圖片中。Dreambooth作為一種主流的圖像定制化，需要微調(diào)擴散模型實現(xiàn)對目標特征的捕捉，因此，SaRA可以直接用于Dreambooth的微調(diào)過程。實驗比較了不同微調(diào)方法在DreamBooth上的表現(xiàn)，定性結(jié)果如圖6所示，可見，SaRA在成功捕捉目標對象特征的同時，還較好地維護了生成圖像語義與文本的一致性。表2計算了不同方法在三個定制化數(shù)據(jù)集上的定量表現(xiàn)，可以看出，SaRA同時兼顧了特征捕捉與圖文一致性，展現(xiàn)了在定制化任務(wù)重的優(yōu)秀表現(xiàn)。

修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)-AI.x社區(qū)

圖6：不同微調(diào)方法在Dreambooth上的定性表現(xiàn)

修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)-AI.x社區(qū)

表2：不同微調(diào)方法在Dreambooth上的定量表現(xiàn)

4.4 視頻生成任務(wù)

SaRA不僅在圖像生成任務(wù)中大展身手，在視頻生成任務(wù)重也同樣能取得較好的結(jié)果。實驗將不同微調(diào)方法應(yīng)用在視頻生成模型AnimateDiff上，在不同運鏡數(shù)據(jù)集下進行微調(diào)（鏡頭放大、縮小、右移）。結(jié)果如圖7所示，其他的微調(diào)方法在視頻生成任務(wù)中展現(xiàn)出一定的過擬合與內(nèi)容崩潰的問題，相較之下，SaRA在微調(diào)過程中展現(xiàn)出豐富的運鏡理解能力，同時較好地維護了模型的先驗，保證了生成視頻的質(zhì)量以及與文本的一致性。

修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)-AI.x社區(qū)

圖7：不同微調(diào)方法在可控運鏡的視頻生成上的表現(xiàn)

4.5 計算資源比較

SaRA引入了非結(jié)構(gòu)化梯度回傳策略，有效解決了基于參數(shù)選擇的微調(diào)方法中遇到的顯存開銷大的問題。圖8的實驗比較了LT-SFT（一種基于參數(shù)選擇的方法）、LoRA以及SaRA在Stable Diffusion 2.0用不同Batch size訓練過程中的顯存開銷與訓練時間。可以看出，SaRA比LT-SFT減少了固定的9.2GB顯存占用（對應(yīng)所有參數(shù)的梯度占用空間），在Batch Size較小時(<=4)節(jié)省了45%的顯存。而LoRA隨著Batchsize的增大，顯存占用急速上升。SaRA在Batch Size=16時比LoRA節(jié)省了52%的顯存占用，并且節(jié)省了49%的訓練時間。

修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)-AI.x社區(qū)

圖8：基于參數(shù)選擇的方法、LoRA、SaRA在不同batch size下的顯存開銷與訓練時間

4.6 訓練參數(shù)分析

一個好的微調(diào)方法，在微調(diào)過程中，應(yīng)該能夠?qū)W習到更多的任務(wù)相關(guān)的信息，同時最大化保留預訓練權(quán)重的先驗知識。因此，作者實驗分析了SaRA與LoRA在Expedition數(shù)據(jù)集上微調(diào)后的學習到的參數(shù)ΔP與預訓練權(quán)重P之間的關(guān)系。表3通過F范數(shù)量化了ΔP前r維子空間與預訓練權(quán)重P子空間的相關(guān)性，可見SaRA學習到的參數(shù)與P相關(guān)性更小，說明相較于LoRA學習到了更多的下游任務(wù)的知識。此外，還計算了放大因子Amplification Factor，量化了ΔP對P中未強調(diào)的特征方向的放大倍數(shù)，同樣證明了SaRA對新知識更強的學習能力。

修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)-AI.x社區(qū)

表3：SaRA與LoRA訓練參數(shù)ΔP，與預訓練參數(shù)P的關(guān)系

圖9計算了SaRA與LoRA訓練后的模型參數(shù)ΔP+P與預訓練參數(shù)P的前r維子空間的相似性，可以看出，SaRA的相似性在95%以上，而LoRA維持在80%附近，證明了融合SaRA訓練參數(shù)的模型，能夠更好地維護預訓練權(quán)重的先驗知識。

修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)-AI.x社區(qū)

圖9：SaRA與LoRA訓練后的模型參數(shù)ΔP+P與預訓練參數(shù)P的關(guān)系

結(jié)論

本文提出了 SaRA，一種新穎的參數(shù)高效微調(diào)方法，該方法充分利用了預訓練模型中絕對值最小的無效參數(shù)。作者提出了一種基于核范數(shù)的低秩損失，以約束學習到的稀疏矩陣的秩，從而避免模型過擬合。此外，設(shè)計了一種漸進式參數(shù)調(diào)整策略，進一步提高了微調(diào)參數(shù)的有效性。最后，提出了一種新型的非結(jié)構(gòu)化反向傳播方法，大大節(jié)省了參數(shù)微調(diào)過程中的內(nèi)存開銷，同時也能降低其他選擇性 PEFT 方法的內(nèi)存成本。大量實驗證明了本文方法的有效性，它在保持預訓練模型的先驗信息的同時，實現(xiàn)了最佳的擬合能力。此外，作者高效地封裝了本文的方法，使其只需修改一行代碼即可實現(xiàn)，這大大增強了代碼在其他模型和任務(wù)中的易用性和適應(yīng)性。

本文轉(zhuǎn)自 AI生成未來，作者：AI生成未來

原文鏈接:??https://mp.weixin.qq.com/s/xPfhcOvyFqV9h6vhZlF-UQ??

標簽

贊

收藏

回復

舉報

回復

相關(guān)推薦

騰訊、上海科大開源InstantMesh，圖片直接生成3D模型

Aceryt ? 4346瀏覽 ? 0回復
6行代碼入門RAG開發(fā)

dsqslgj ? 3345瀏覽 ? 0回復
邁向統(tǒng)一擴散框架！Adobe提出RGB?X：雙重利好下游編輯任務(wù) | SIGGRAPH'24

angel ? 3484瀏覽 ? 0回復
蘋果超強視覺預訓練模型助力下游任務(wù)拿SOTA?。ǚ诸悺z測、分割、深度估計）

angel ? 4459瀏覽 ? 0回復
AI 監(jiān)控個人 PC“一舉一動”？兩行代碼即可繞過保護措施，Windows 新功能受抵制！

51CTO技術(shù)棧 ? 3074瀏覽 ? 0回復
上海交大&阿里巴巴推出虛擬試衣新里程碑式工作——AnyFit：任意場景、任意組合！

angel ? 3197瀏覽 ? 0回復
Google推出開源代碼大模型CodeGemma：AI編程新紀元，代碼自動完成和生成技術(shù)再升級

AI論文解讀 ? 3462瀏覽 ? 0回復
從零實現(xiàn)大模型-GPT2任務(wù)微調(diào)

魚蟲子 ? 3642瀏覽 ? 0回復
上海交大、復旦、上海 AI Lab引入漸進學習框架來驗證弱到強的推理

sbf_2000 ? 2714瀏覽 ? 0回復
Stability.ai開源3D模型，僅需0.5秒就能快速生成

Aceryt ? 3541瀏覽 ? 0回復
隨意畫個草圖就能生成3D交互游戲場景！騰訊XR出品

angel ? 3995瀏覽 ? 0回復
上海交大等聯(lián)合發(fā)布MegaFusion：無須微調(diào)的高效高分辨率圖像生成方法

angel ? 2876瀏覽 ? 0回復
一款好用的開源工具，高效實現(xiàn)Reranker

恰似驚鴻 ? 4012瀏覽 ? 0回復
微調(diào)谷歌開源Gemini Flash模型實現(xiàn)PII脫敏實戰(zhàn)

51CTO內(nèi)容精選 ? 3073瀏覽 ? 0回復
RAG檢索增強生成和大模型微調(diào)的抉擇

AI探索時代 ? 2548瀏覽 ? 0回復
DeepSeek開源DeepGEMM，僅300行代碼

Aceryt ? 2344瀏覽 ? 0回復
DeepSeek V3 0324：就在剛剛，DeepSeek悄悄更新，700行代碼一氣呵成！

Halo咯咯 ? 2661瀏覽 ? 0回復
字節(jié) TileLink：編譯生成高效的計算和通信 Overlap Kernel

amei2000go ? 2474瀏覽 ? 0回復
6行代碼讓你的應(yīng)用也能調(diào)用Mcp工具！

Syrupup ? 2205瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

多領(lǐng)域SOTA誕生！Vid2World：打通視頻擴散到世界模型的“任督二脈”｜清華、重大 2025-05-23 10:17:32發(fā)布
多模態(tài)終極大一統(tǒng)！字節(jié)開源BAGEL爆火：圖文生成理解雙冠王，竟能預測未來畫面？ 2025-05-22 09:33:05發(fā)布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇：一文詳解3D內(nèi)容生成算法（樸素/2D先驗/混合型）

下一篇：騰訊&新加坡國立發(fā)布IFAdapter：即插即用，提升文生圖模型實例特征和位置生成準確性

社區(qū)精華內(nèi)容

目錄

主站蜘蛛池模板：中文字幕在线一区二区三区 | 特级毛片爽www免费版 | 99久久精品一区二区成人 | 国产免费拔擦拔擦8x高清 | 涩在线 | a在线观看 | 成人福利视频 | 男人的天堂一级片 | 欧美亚洲视频在线观看 | 91网站在线播放 | 欧美日韩精品一区二区三区视频 | 国产一区欧美一区 | 国产色片在线 | 欧美精品综合在线 | 亚洲一区二区三区四区视频 | 天天看天天爽 | 亚洲精品综合精品自拍 | 亚洲电影第三页 | 国产视频第一页 | 亚洲欧美在线观看 | 精品国产一区二区三区久久久久久 | a黄视频 | 国产一级一片免费播放 | 国产精品精品视频一区二区三区 | 亚洲综合日韩精品欧美综合区 | 99视频精品 | 婷婷色在线 | 久久久久国产 | 久久精品一区二区三区四区 | 日日夜夜狠狠操 | 亚洲高清成人在线 | 国户精品久久久久久久久久久不卡 | 久久高清精品 | 在线观看精品视频网站 | 在线激情视频 | 亚洲成人国产 | 国产一区二区三区免费 | 日韩视频中文字幕 | 一区二区三区中文字幕 | 天天综合网天天综合 | 国产欧美精品在线观看 |

<ol id="esfqw"><dl id="esfqw"></dl></ol>

<button id="esfqw"><form id="esfqw"></form></button>

<code id="esfqw"><wbr id="esfqw"><sup id="esfqw"></sup></wbr></code>

<code id="esfqw"><strong id="esfqw"><td id="esfqw"></td></strong></code><cite id="esfqw"></cite>