成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

一篇學會本地知識庫對LLM的性能優化

運維
實際上因為訓練模型難度比較大,一些人已經放棄了自己訓練模型,而采用將本地知識庫矢量化后進行較為精準的檢索,然后通過AUTOPROMPT將檢索后的結果生成自動提示,去問打語音模型。

昨天一個跑了220個小時的微調訓練完成了,主要任務是想在CHATGLM-6B上微調出一個能夠較為精確的診斷數據庫錯誤信息的對話模型來。

圖片

不過這個等了將近十天的訓練最后的結果令人失望,比起我之前做的一個樣本覆蓋更小的訓練來,差的還是挺大的。

圖片

這樣的結果還是有點令人失望的,這個模型基本上是沒有實用價值的。看樣子需要重新調整參數與訓練集,再做一次訓練。大語言模型的訓練是一場軍備競賽,沒有好的裝備是玩不起來的。看樣子我們也必須要升級一下實驗室的裝備了,否則沒有幾個十天可以浪費。

從最近的幾次失敗的微調訓練來看,微調訓練這條路也并不容易完成。不同的任務目標混雜在一起跑訓練,可能不同的任務目標需要的訓練參數不同,使最終的訓練集無法滿足某些任務的需求。因此PTUNING只適合某個十分確定的任務,不一定適合混合任務,以混合任務為目的的模型,可能需要用FINETUNE。這和前幾天我在和一個朋友交流時大家的觀點類似。

實際上因為訓練模型難度比較大,一些人已經放棄了自己訓練模型,而采用將本地知識庫矢量化后進行較為精準的檢索,然后通過AUTOPROMPT將檢索后的結果生成自動提示,去問打語音模型。利用langchain很容易實現這個目標。

圖片

這個工作的原理是將本地文檔通過加載器加載為文本,然后對文本進行切分行程文本片段,經過編碼后寫入向量存儲中功查詢使用。查詢結果出來后,通過Prompt Template自動形成提問用的提示,去詢問LLM,LLM生成最后的回答。

這項工作里有另個要點,一個是較為精準的搜索到本地知識庫中的知識,這個通過向量存儲于搜索來實現,目前針對中英文的本地知識庫的向量化與搜索的解決方案很多,可以選擇某個對你的知識庫比較友好的方案來使用。

圖片

上面是一個在vicuna-13b上通過關于OB的知識庫進行的問答,上面的是沒有使用本地知識庫,直接使用LLM的能力的回答,下面是加載了本地知識庫后的回答。可以看出性能提升還是挺明顯的。

圖片

我們再來看看剛才那個ORA錯誤的問題,在沒有使用本地知識庫之前,LLM基本上是胡說八道的,而加載了本地知識庫之后,這個回答還是中規中矩的,文中的錯別字也是我們知識庫中的錯誤。實際上PTUNING使用的訓練集也是通過這個本地知識庫生成出來的。

從最近我們踩過的坑可以收獲一些經驗。首先ptuning的難度比我們想象得要高得多,雖然說ptuning比finetune需要的裝備低一點,不過訓練難度一點都不低。其次是通過Langchain和autoprompt利用本地知識庫來改善LLM能力效果不錯,對于大多數企業應用來說,只要把本地知識庫梳理好,選擇合適的矢量化方案,應該都能獲得不比PTUNING/FINETUNE差的效果。第三,還是上回說的那個問題,LLM的能力至關重要。必須選擇一個能力較強的LLM作為基礎模型來使用。任何嵌入式模型都只能局部改善能力,不能起決定性的作用。第四,對于數據庫相關的知識,vicuna-13b的能力確實不錯。

今天一大早還要去客戶那邊做個交流,早上時間有限,就簡單寫幾句吧。大家對此有何心得,歡迎留言討論(討論僅你我可見),我也是在這條路上孤獨行走,希望有同路人指點一二。

責任編輯:武曉燕 來源: 白鱔的洞穴
相關推薦

2021-06-02 08:25:44

性能優化Repository

2022-08-23 08:00:59

磁盤性能網絡

2022-09-23 07:15:22

docker網絡Liunx

2025-02-14 00:00:35

2022-06-09 08:41:17

Go網絡庫Gnet

2022-02-07 11:01:23

ZooKeeper

2022-01-02 08:43:46

Python

2021-05-27 07:12:19

Python函數裝飾器

2021-10-26 10:40:26

代理模式虛擬

2021-12-04 22:05:02

Linux

2022-05-17 08:02:55

GoTryLock模式

2022-03-02 11:37:57

參數性能調優

2022-06-30 22:53:18

數據結構算法

2021-08-01 07:19:16

語言OpenrestyNginx

2021-07-02 08:51:29

源碼參數Thread

2021-09-28 08:59:30

復原IP地址

2021-10-14 10:22:19

逃逸JVM性能

2022-04-12 08:30:52

回調函數代碼調試

2021-10-27 09:59:35

存儲

2021-07-16 22:43:10

Go并發Golang
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 色综合色综合色综合 | avhd101在线成人播放 | 亚洲欧洲色视频 | 天天操天天拍 | 久久天天躁狠狠躁夜夜躁2014 | 久久久久久91 | 亚洲精品日韩一区二区电影 | 久久亚洲一区 | 亚洲国产二区 | 亚洲欧美日韩成人在线 | 一级在线观看 | 久久大 | 91xxx在线观看 | 成人在线精品 | 亚洲成人综合网站 | 操操操操操 | 中文字幕一区二区三区在线观看 | 一区在线观看视频 | 毛片99 | 国产精品久久久久久久久久久久久久 | 黄色永久免费 | 日本成人三级电影 | 久久av资源网 | 超碰伊人久久 | 欧美精品在线免费观看 | 亚洲精品视频免费观看 | 狠狠操狠狠搞 | 在线观看视频h | 亚洲欧美一区二区在线观看 | 天天色天天射天天干 | 亚洲国产精品一区二区久久 | 久久综合一区 | 国产一区不卡 | 三级黄色片在线 | 91新视频 | 亚洲视频免费在线观看 | 91精品国产综合久久久动漫日韩 | 精品国产一区二区国模嫣然 | 久久久久久91香蕉国产 | 日韩黄色小视频 | 99免费|