成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

DyPRAG:即插即用動態將上下文轉化為參數知識,有效緩解RAG幻覺 原創

發布于 2025-4-3 07:34
瀏覽
0收藏

來自fans投稿,提出動態參數化RAG,即插即用無縫和RAG結合,減少RAG幻覺的發生,來看看具體思路。

檢索增強生成(RAG)通過從外部源檢索相關文檔并將其合并到上下文中來增強大語言模型(LLMs)。雖然它通過提供事實文本提高了可靠性,但隨著上下文長度的增長,顯著增加了推理成本,并引入了具有挑戰性的RAG幻覺問題,這主要是由于LLM中缺乏相應的參數知識造成的。

參數化RAG (PRAG)通過離線訓練將文檔嵌入大模型參數有效地降低推理成本。然而其高昂的訓練和存儲成本以及有限的泛化能力,極大地限制了其實際應用。

我們提出動態參數化RAG,在推理時將文檔知識動態轉化為模型參數知識,能有效補充相應知識。并且能即插即用無縫和RAG結合,提升模型知識內化水平同時減少RAG幻覺的發生

DyPRAG:即插即用動態將上下文轉化為參數知識,有效緩解RAG幻覺-AI.x社區

論文:Better wit than wealth: Dynamic Parametric Retrieval Augmented Generation for Test-time Knowledge Enhancement

鏈接:https://arxiv.org/pdf/2503.23895

項目:https://github.com/Trae1ounG/DyPRAG

方法

檢索增強生成(RAG)

DyPRAG:即插即用動態將上下文轉化為參數知識,有效緩解RAG幻覺-AI.x社區

參數化RAG(PRAG)

DyPRAG:即插即用動態將上下文轉化為參數知識,有效緩解RAG幻覺-AI.x社區

然而,PRAG的訓練成本較高,且難以適應新文檔。因此,我們提出動態參數化RAG(DyPRAG),實現更高效的參數注入。

動態參數化RAG(DyPRAG)

DyPRAG的核心思路在于訓練一個輕量的參數轉換器來建模從文檔->參數的潛在映射,僅需要少量的訓練數據就能有效學習到泛化性極強的轉換器,在推理時幾乎不會引入額外的計算開銷且能提升模型性能,最少只需要2MB存儲開銷

DyPRAG:即插即用動態將上下文轉化為參數知識,有效緩解RAG幻覺-AI.x社區

DyPRAG對比RAG和PRAG

1. 文檔-參數對收集(離線)

DyPRAG:即插即用動態將上下文轉化為參數知識,有效緩解RAG幻覺-AI.x社區

2. 訓練動態參數翻譯器(離線)

DyPRAG:即插即用動態將上下文轉化為參數知識,有效緩解RAG幻覺-AI.x社區

DyPRAG:即插即用動態將上下文轉化為參數知識,有效緩解RAG幻覺-AI.x社區

DyPRAG:即插即用動態將上下文轉化為參數知識,有效緩解RAG幻覺-AI.x社區

MLP超網絡工作流程

DyPRAG:即插即用動態將上下文轉化為參數知識,有效緩解RAG幻覺-AI.x社區

3. 高效推理(在線)

DyPRAG:即插即用動態將上下文轉化為參數知識,有效緩解RAG幻覺-AI.x社區

DyPRAG:即插即用動態將上下文轉化為參數知識,有效緩解RAG幻覺-AI.x社區

DyPRAG整體框架圖

實驗

分布內QA實驗

在多個問答數據集上訓練參數轉換器并進行實驗,DyPRAG表現出極優的性能:

  • DyPRAG能有效注入參數知識:對比RAG,在沒有提供任何文檔拼接到上下文的情況下,DyPRAG表現出明顯優于RAG的性能同時減少了推理開銷。
  • 上下文知識+動態生成參數知識有效促進知識融合:DyPRAG-Combine將文檔加入上下文結合動態生成參數知識,在所有情況下取得最好效果,有效促進了模型知識和上下文知識的融合。

DyPRAG:即插即用動態將上下文轉化為參數知識,有效緩解RAG幻覺-AI.x社區

分布內主實驗

分布外QA實驗

DyPRAG能有效轉換分布外的文檔到參數知識,在補充參數知識后始終可以作為相比RAG更強更魯棒的基線。

DyPRAG:即插即用動態將上下文轉化為參數知識,有效緩解RAG幻覺-AI.x社區

分布外數據集實現

為什么DyPRAG能減少RAG幻覺?

  • RAG幻覺(或叫知識沖突)經常由于模型內部知識和外部提供上下文知識發生沖突導致發生。可能模型包含正確的參數知識結合上下文知識報錯,也可能上下文知識正確模型包含錯誤參數知識導致模型回答錯誤。
  • DyPRAG首先動態將檢索文檔轉換為模型參數知識,提前讓模型“做足了功課”,在遇到相對應的上下文內容時就能極大程度避免知識沖突發生,這也是DyPRAG-Combine性能提升的直接來源,極低的開銷使得DyPRAG有希望成為RAG幻覺的有效解決方式。

DyPRAG:即插即用動態將上下文轉化為參數知識,有效緩解RAG幻覺-AI.x社區

RAG幻覺示例分析

知識內化實驗

基于RAGTruth幻覺數據集衡量DyPRAG-Combine對知識的內化程度(使用GPT-4o打分)。

RAGTruth中的文檔來源和訓練時完全不同并且大模型訓練時完全沒有見過——DyPRAG能有效將沒有見過知識進行內化,內化程度顯著優于RAG方法。

DyPRAG:即插即用動態將上下文轉化為參數知識,有效緩解RAG幻覺-AI.x社區

RAGTruth數據集驗證

計算/存儲開銷

通過詳細的時間復雜度計算和實際運行時間對比,我們提出的DyPRAG能有效提升模型性能,同時減少RAG帶來的高推理開銷以及PRAG帶來的極高訓練和存儲開銷(僅1%),更證明方法即插即用提升性能的高可用性!

DyPRAG:即插即用動態將上下文轉化為參數知識,有效緩解RAG幻覺-AI.x社區

實際存儲和訓練開銷

DyPRAG:即插即用動態將上下文轉化為參數知識,有效緩解RAG幻覺-AI.x社區

理論分析推理、存儲、訓練開銷

結論

  • 我們提出動態參數化RAG (Dynamic Parametric RAG),一個輕量級框架可以以即插即用的方式以最小的成本有效地將文檔轉換為參數
  • 我們提出了一個強大而實用的RAG范式:有效地將上下文知識與測試時動態生成的參數知識結合起來,實現更強大的知識融合
  • 實驗結果表明,DyPRAG具有極優的泛化能力,能夠有效地注入參數并無縫地融合上下文知識,在減少RAG幻覺的同時提高了模型性能


公眾號大模型自然語言處理  作者:余俊暉

原文鏈接:??https://mp.weixin.qq.com/s/d_WS0S3KT4XjbJHBoOFYFA??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
標簽
已于2025-4-3 07:34:15修改
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: av黄色在线观看 | 国产精品久久国产精品久久 | 欧洲一级黄 | 在线看国产| 欧美区日韩区 | 国产欧美一区二区三区久久 | 久久国产一区 | 成人免费视频网站 | 日韩在线免费视频 | 激情国产视频 | 青青久久av北条麻妃海外网 | 色女人天堂 | v片网站 | 一级在线毛片 | 天堂影院av | 亚洲一区中文 | 久久精品成人一区 | 免费污视频 | 亚洲精品一区二区三区中文字幕 | 91精品国产综合久久久动漫日韩 | 97免费在线观看视频 | 久久99深爱久久99精品 | 黄网站涩免费蜜桃网站 | 成人精品福利 | 日韩精品一区二区三区中文在线 | 久久久成人免费一区二区 | 日韩精品一区二区三区视频播放 | 欧美网站一区二区 | 国产成人精品一区二 | 精品福利在线 | 国产欧美精品一区二区三区 | 黄色网络在线观看 | 一区二区免费视频 | 欧美精品一区在线 | 一级国产精品一级国产精品片 | 日韩高清中文字幕 | 亚洲综合色视频在线观看 | 久久久久久久久久久久久九 | 2023亚洲天堂 | 男人的天堂中文字幕 | 精品久久久久久久久久久 |