成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大模型微調(diào)方法之QLoRA 原創(chuàng)

發(fā)布于 2024-10-15 14:00
瀏覽
0收藏

?本文介紹大模型微調(diào)方法中的QLoRA。

QLoRA由華盛頓大學(xué)UW NLP小組的成員于2023年提出發(fā),旨在進(jìn)一步降低微調(diào)大模型的微調(diào)成本,因?yàn)閷?duì)于上百億參數(shù)量的模型,LoRA微調(diào)的成本還是很高。

感興趣的小伙伴可以去閱讀一下原文:https://arxiv.org/pdf/2305.14314

模型介紹

大模型微調(diào)方法之QLoRA-AI.x社區(qū)

上圖為QLoRA的訓(xùn)練過(guò)程圖,QLoRA更多的是在工程上進(jìn)行了量化和優(yōu)化,從圖中可知,主要有4個(gè)部分的改進(jìn):

  • QLORA:是一種優(yōu)化的4-bit量化數(shù)據(jù)類(lèi)型,專(zhuān)為正態(tài)分布權(quán)重設(shè)計(jì),通過(guò)結(jié)合低精度存儲(chǔ)和中等精度計(jì)算來(lái)提升模型性能。它使用4-bit存儲(chǔ)權(quán)重以減少內(nèi)存使用,并在計(jì)算時(shí)將權(quán)重轉(zhuǎn)換為16-bit的BFloat16格式以保持準(zhǔn)確性。這種方法適用于模型加載和訓(xùn)練過(guò)程,旨在平衡存儲(chǔ)效率和計(jì)算精度。
  • Double Quantization:是一種模型量化技術(shù),它通過(guò)對(duì)已經(jīng)量化過(guò)的常量進(jìn)行二次量化,進(jìn)一步減少存儲(chǔ)空間的需求。這種方法比傳統(tǒng)的模型量化方法更能節(jié)省顯存空間,每個(gè)參數(shù)平均可以節(jié)省0.37bit。例如,在65B的LLaMA模型中,這種雙量化技術(shù)能夠節(jié)省大約3GB的顯存空間。
  • Paged Optimizers:是一種利用NVIDIA統(tǒng)一內(nèi)存特性的優(yōu)化技術(shù),旨在解決GPU在處理過(guò)程中偶爾出現(xiàn)內(nèi)存溢出(OOM)的問(wèn)題。該技術(shù)通過(guò)自動(dòng)在CPU和GPU之間進(jìn)行分頁(yè)到分頁(yè)的數(shù)據(jù)傳輸,確保GPU處理過(guò)程無(wú)錯(cuò)誤進(jìn)行。其工作原理類(lèi)似于CPU內(nèi)存與磁盤(pán)之間的常規(guī)內(nèi)存分頁(yè)機(jī)制。具體來(lái)說(shuō),Paged Optimizers為優(yōu)化器狀態(tài)分配分頁(yè)內(nèi)存,當(dāng)GPU內(nèi)存不足時(shí),自動(dòng)將優(yōu)化器狀態(tài)卸載到CPU內(nèi)存中;而在需要更新優(yōu)化器狀態(tài)時(shí),再將其加載回GPU內(nèi)存。
  • Adapter:為了彌補(bǔ)4-bit NormalFloat和Double Quantization帶來(lái)的性能損失,作者采用了插入更多adapter的方法。在LoRA中,通常只在query和value的全連接層處插入adapter。而在QLoRA中,作者在所有全連接層處都插入了adapter,以增加訓(xùn)練參數(shù)并彌補(bǔ)由于精度降低而導(dǎo)致的性能損失。

Adapter實(shí)現(xiàn)

QLoRA的一個(gè)重要的改進(jìn)和核心工作則是將量化的思想和LoRA的低秩適配器的思想結(jié)合到一起拿來(lái)對(duì)大模型進(jìn)行微調(diào),因此單獨(dú)拎出來(lái)說(shuō),實(shí)現(xiàn)的代碼如下:

if checkpoint_dir is not None:
    print("Loading adapters from checkpoint.")
    model = PeftModel.from_pretrained(model, join(checkpoint_dir, 'adapter_model'), is_trainable=True)
else:
    print(f'adding LoRA modules...')
    modules = find_all_linear_names(args, model)
    config = LoraConfig(
        r=args.lora_r,
        lora_alpha=args.lora_alpha,
        target_modules=modules,
        lora_dropout=args.lora_dropout,
        bias="none",
        task_type="CAUSAL_LM",
    )
    model = get_peft_model(model, config)
  • ???find_all_linear_names???:找到所有的全連接層
  • ???get_peft_model???:在所有全連接層中插入LoRA模塊

?

本文轉(zhuǎn)載自公眾號(hào)瓦力算法學(xué)研所,作者:喜歡瓦力的卷卷

原文鏈接:??https://mp.weixin.qq.com/s/i1kJ7kwIIG_qIsfEAei7mQ???

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 欧美一级淫片免费视频黄 | 日韩欧美视频 | 精品一区电影 | 亚洲精品乱码久久久久久按摩观 | 成人国产在线观看 | 久久久久久免费观看 | 久久999| 国产无套一区二区三区久久 | 免费成人高清在线视频 | 久久国产精品一区二区三区 | 午夜一区 | 成年人在线观看视频 | 成人免费视频在线观看 | 免费影视在线观看 | 天天玩天天干天天操 | 视频一区二区在线观看 | 欧美a在线 | 91av国产在线视频 | 91一区二区 | 亚洲一区二区在线 | 亚洲成人精品 | 国产日韩欧美激情 | 天堂中文字幕av | 日韩成人免费在线视频 | 欧美日韩中文国产一区发布 | caoporn地址| www.一区二区三区.com | 国产在线一区二 | 国产中文字幕在线观看 | 播放一级黄色片 | 91在线网站| 成人在线免费视频 | 日韩1区2区| 青青草一区二区三区 | www.欧美视频 | 亚洲激情综合网 | 99久久久无码国产精品 | 久久精品国产一区二区电影 | 国产精品久久精品 | 亚洲国产视频一区二区 | 欧美中文字幕 |