成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

比LoRA還快50%的微調方法來了!一張3090性能超越全參調優,UIUC聯合LMFlow團隊提出LISA

人工智能 新聞
UIUC 聯合 LMFlow 團隊成員對 LoRA 的實驗性質進行了分析,意外發現 LoRA 非常側重 LLM 的底層和頂層的權重。利用這一特性,LMFlow 團隊提出一個極其簡潔的算法:Layerwise Importance Sampled AdamW(LISA)。

2022 年底,隨著 ChatGPT 的爆火,人類正式進入了大模型時代。然而,訓練大模型需要的時空消耗依然居高不下,給大模型的普及和發展帶來了巨大困難。面對這一挑戰,原先在計算機視覺領域流行的 LoRA 技術成功轉型大模型 [1][2],帶來了接近 2 倍的時間加速和理論最高 8 倍的空間壓縮,將微調技術帶進千家萬戶。

但 LoRA 技術仍存在一定的挑戰。一是 LoRA 技術在很多任務上還沒有超過正常的全參數微調 [2][3][4],二是 LoRA 的理論性質分析比較困難,給其進一步的研究帶來了阻礙。

UIUC 聯合 LMFlow 團隊成員對 LoRA 的實驗性質進行了分析,意外發現 LoRA 非常側重 LLM 的底層和頂層的權重。利用這一特性,LMFlow 團隊提出一個極其簡潔的算法:Layerwise Importance Sampled AdamW(LISA)。

圖片


  • 論文鏈接:https://arxiv.org/abs/2403.17919
  • 開源地址:https://github.com/OptimalScale/LMFlow

LISA 介紹

LISA 算法的核心在于:

- 始終更新底層 embedding 和頂層 linear head;

- 隨機更新少數中間的 self-attention 層,比如 2-4 層。

出乎意料的是,實驗發現該算法在指令微調任務上超過 LoRA 甚至全參數微調。

圖片

圖片

更重要的是,其空間消耗和 LoRA 相當甚至更低。70B 的總空間消耗降低到了 80G*4,而 7B 則直接降到了單卡 24G 以下!

進一步的,因為 LISA 每次中間只會激活一小部分參數,算法對更深的網絡,以及梯度檢查點技術(Gradient Checkpointing)也很友好,能夠帶來更大的空間節省。

在指令微調任務上,LISA 的收斂性質比 LoRA 有很大提升,達到了全參數調節的水平。

而且,由于不需要像 LoRA 一樣引入額外的 adapter 結構,LISA 的計算量小于 LoRA,速度比 LoRA 快將近 50%。

理論性質上,LISA 也比 LoRA 更容易分析,Gradient Sparsification、Importance Sampling、Randomized Block-Coordinate Descent 等現有優化領域的數學工具都可以用于分析 LISA 及其變種的收斂性質。

一鍵使用 LISA

為了貢獻大模型開源社區,LMFlow 現已集成 LISA,安裝完成后只需一條指令就可以使用 LISA 進行微調:

如果需要進一步減少大模型微調的空間消耗,LMFlow 也已經支持一系列最新技術:

如果在使用過程中遇到任何問題,可通過 github issue 或 github 主頁的微信群聯系作者團隊。LMFlow 將持續維護并集成最新技術。 

總結

在大模型競賽的趨勢下,LMFlow 中的 LISA 為所有人提供了 LoRA 以外的第二個選項,讓大多數普通玩家可以通過這些技術參與到這場使用和研究大模型的浪潮中來。正如團隊口號所表達的:讓每個人都能訓得起大模型(Large Language Model for All)。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-11-12 14:20:00

模型AI

2023-10-04 10:38:38

模型方法

2011-03-10 14:40:54

LAMPMysql

2017-07-21 08:55:13

TomcatJVM容器

2025-01-26 10:19:21

2020-01-14 09:13:48

Tomcat調優配置

2012-01-10 14:35:08

JavaJVM

2012-06-20 11:05:47

性能調優攻略

2023-02-05 13:06:07

ChatGPT看圖方法

2016-03-25 09:59:38

性能調優LinuxMySQL

2009-04-01 11:17:52

內存分配調優Oracle

2021-03-04 08:39:21

SparkRDD調優

2024-06-06 08:25:30

2013-03-18 15:35:30

2022-04-01 08:02:44

云成本服務器互聯網

2011-05-20 15:02:01

Oracle性能調優

2011-11-14 10:28:23

2020-11-30 11:40:35

NginxLinux性能調優

2023-08-09 17:38:47

模型AI

2024-05-27 09:16:37

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚欧性视频 | 欧美在线精品一区 | 中文字幕av网 | 黑人精品| 一区二区三区在线免费看 | 日本小视频网站 | 精品一区二区三区在线观看 | 久久毛片 | 日韩成人免费视频 | 亚洲国产精品成人综合久久久 | 国产精品美女久久久久久不卡 | 欧美性生活免费 | 亚洲国产一区视频 | 伊人色综合久久久天天蜜桃 | 国产在线观看 | 欧美日韩视频 | 欧美日韩中文字幕在线 | 日韩欧美亚洲 | 久久高潮 | 91美女在线| 日本精品视频在线观看 | av在线免费观看不卡 | 国产精品美女久久久久久久久久久 | 国产精品久久国产精品 | 在线观看免费av网站 | 国产在线一级片 | 欧美老妇交乱视频 | 日本三级做a全过程在线观看 | 91国产精品 | 亚洲一区久久 | 91久久看片| 国产精品日韩欧美一区二区三区 | 国产精品成人一区 | 国产成人精品免高潮在线观看 | 一级毛片免费视频观看 | 91网站在线看 | 国产乱肥老妇国产一区二 | 中文字幕三区 | 亚洲高清久久 | 午夜精品一区二区三区在线视频 | 网站黄色在线免费观看 |