成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

提升5.69倍,高效RAG上下文壓縮方法COCOM

發布于 2024-7-22 06:53
瀏覽
0收藏

GPT-4、Llama等開閉大模型通過預訓練的方式將海量數據積累成一個龐大的知識庫,再通過文本問答的形式為用戶生成各種內容。但這種方法僅局限于訓練數據集,為了擴大輸出范圍允許模型通過檢索額外的數據來豐富生成內容,RAG(知識檢索增強)成為了必備功能之一。


RAG也有一個明顯的缺點,就是隨著上下文信息量的增加,模型的解碼時間顯著延長,嚴重影響用戶獲取答案的效率。


所以,阿姆斯特丹大學、昆士蘭大學和NAVER實驗室的研究人員聯合發布了創新壓縮方法COCOM(Context COmpression Model)。


論文地址:https://arxiv.org/abs/2407.09252

提升5.69倍,高效RAG上下文壓縮方法COCOM-AI.x社區

在傳統的RAG模型中,為了生成一個準確的答案,系統需要考慮大量的上下文信息。這些信息可能來自多個文檔,每個文檔都包含了對生成答案可能有用的信息。


不過將這些長文本直接輸入到大模型中會導致解碼時間顯著增加,因為模型需要處理更多的輸入數據,消耗的算力和推理時間也就更多。


COCOM使用了一種創新的上下文壓縮技術,將長文本上下文轉換成一組緊湊的上下文嵌入。這些嵌入能夠捕捉原始文本的關鍵信息,并以一種更高效的方式提供給大模型,能夠在減少模型輸入大小的同時,保持提升生成內容的質量。


COCOM還使用了一個轉換器,幫助大模型對輸入的上下文進行分詞處理,將其轉換成一系列的標記。然后,這些標記被輸入到一個壓縮模型中,并負責將這些標記轉換成一組上下文嵌入。

提升5.69倍,高效RAG上下文壓縮方法COCOM-AI.x社區

在壓縮模型的訓練過程中,研究者們采用了兩種主要的預訓練任務:自編碼和基于上下文嵌入的語言建模。自編碼任務的目標是訓練模型將上下文嵌入重構回原始的輸入文本,這有助于模型學習如何有效地壓縮和解壓上下文信息。


而基于上下文嵌入的語言建模任務則是訓練模型根據壓縮后的嵌入生成文本的下一部分,這有助于模型學習如何利用上下文嵌入中的信息。


值得一提的是,COCOM的壓縮率非常靈活可以調節,通過調整壓縮率參數幫助開發人員在減少解碼時間和保持答案質量之間找到一個平衡點。


例如,一個較低的壓縮率可能會生成更多的嵌入,從而保留更多的上下文信息,但同時也會略微增加解碼時間。相反,一個較高的壓縮率會減少生成的嵌入數量,從而加快解碼效率,但可能會犧牲一些生成答案的質量。


此外,COCOM還能夠處理多個上下文的情況。在知識密集型任務中,通常需要從多個文檔中提取信息以生成答案。COCOM能夠獨立地壓縮每個文檔的上下文,并將生成的嵌入向量作為一組提供給大模型,這種方法能幫助模型在處理多個上下文時仍保持高效率。

提升5.69倍,高效RAG上下文壓縮方法COCOM-AI.x社區

研究人員在Natural Questions、MS MARCO、HotpotQA測試平臺中評估了COCOM,并與現有AutoCompressor、xRAG、ICAE等壓縮方法進行比較,COCOM的效率能提升5.69倍,內存減少1.27倍。


本文轉自 AIGC開放社區 ,作者:AIGC開放社區


原文鏈接:??https://mp.weixin.qq.com/s/C2r3GYpcK-B8RZevC1ejEw??

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 性生活毛片| 凹凸日日摸日日碰夜夜 | 国产 日韩 欧美 中文 在线播放 | 精品一级 | 欧美国产日韩一区二区三区 | 欧美成人精品在线 | 国产不卡在线播放 | 久久精品一区二区三区四区 | 中国免费黄色片 | av一级久久 | 国产在线永久免费 | 亚洲午夜网 | 日韩精品一区二区三区在线播放 | 国产精品五区 | 欧美日韩国产中文 | 国产精品视频专区 | 亚洲一区二区三区免费视频 | 亚洲欧美男人天堂 | 久久免费福利 | 伊人精品久久久久77777 | 国产一区二区久久 | 日韩一区二区三区av | 91久久国产综合久久91精品网站 | 一区二区三区精品视频 | 性高湖久久久久久久久3小时 | 欧美一区二区三区久久精品 | 欧美精品国产精品 | 成人在线视 | 老头搡老女人毛片视频在线看 | 成人影音| 亚洲视频精品在线 | 蜜桃精品噜噜噜成人av | 国产亚洲欧美日韩精品一区二区三区 | 欧美精品成人一区二区三区四区 | 精品区一区二区 | 国产精品久久99 | 激情一区二区三区 | 成人精品久久 | 亚洲免费视频网址 | 北条麻妃一区二区三区在线观看 | 国产一级片免费在线观看 |