基于KG生成語料增強解決RAG問答幻覺問題的簡單框架-Walk&Retrieve 原創

大模型自然語言處理

發布于 2025-5-30 06:44

瀏覽

0收藏

Walk&Retrieve基于知識圖譜，利用基于圖遍歷和知識表述來進行零樣本RAG的語料庫生成。解決RAG系統的幻覺問題。該框架思路比較簡單，核心點在于零樣本RAG的語料庫生成，下面來看看，供參考。

基于KG生成語料增強解決RAG問答幻覺問題的簡單框架-Walk&Retrieve-AI.x社區

方法架構

語料生成

在框架中，語料生成該方法的核心步驟。該階段從知識圖譜中提取相關信息，并將其轉化為適合LLM處理的文本格式。語料生成包括以下幾個步驟：基于圖的遍歷、知識表示和索引。

1.基于圖的遍歷

隨機游走：隨機游走是一種隨機過程，從一個節點開始，每次以均勻的概率選擇當前節點的鄰居節點進行移動。

基于KG生成語料增強解決RAG問答幻覺問題的簡單框架-Walk&Retrieve-AI.x社區

優點：簡單易行，適用于大規模圖譜。
缺點：可能會產生重復路徑和噪聲。

廣度優先搜索-BFS游走：BFS是一種圖遍歷算法，從根節點開始，逐層訪問其鄰居節點。對于每個根節點

基于KG生成語料增強解決RAG問答幻覺問題的簡單框架-Walk&Retrieve-AI.x社區

構建一個層次結構，每一層的節點表示與根節點的最短路徑距離。然后，按照層次順序進行遍歷，確保每個節點只被訪問一次。

基于KG生成語料增強解決RAG問答幻覺問題的簡單框架-Walk&Retrieve-AI.x社區

其中，L₀={v₂}，d 是最大深度。

優點：避免了重復路徑，生成的游走路徑更加多樣化。
缺點：計算復雜度較高，尤其是在深層遍歷時。

2.知識表示

LLM需要文本輸入，需要將提取的圖遍歷路徑轉換為自然語言描述。使用預定義的提示模板，將每個節點的游走路徑轉化為自然語言句子。例如，對于一個隨機游走的路徑，可以生成類似“ 通過關系連接到，而通過關系連接到 ”的句子。

基于KG生成語料增強解決RAG問答幻覺問題的簡單框架-Walk&Retrieve-AI.x社區

預定義的提示模板

3.索引

將每個游走路徑轉換為向量表示，并計算每個節點的全局表示，作為其所有游走路徑向量的拼接。將節點及其對應的游走路徑向量存儲起來，便于在推理階段進行快速檢索。

檢索問答

該階段不是重點，與傳統的RAG相同，包括將query編碼、相似性檢索（k近鄰搜索）、上下文整合、答案生成。

基于KG生成語料增強解決RAG問答幻覺問題的簡單框架-Walk&Retrieve-AI.x社區

答案生成prompt模板

實驗性能

基于KG生成語料增強解決RAG問答幻覺問題的簡單框架-Walk&Retrieve-AI.x社區

MetaQA上的性能：Walk&Retrieve-BFS在答案準確性和減少虛假答案方面表現最佳，相對提高了38.64%。其他基于KG的RAG系統雖然準確性高，但虛假答案更多。Walk&Retrieve-BFS在1跳、2跳和3跳問題上的真實性和減少無響應方面表現優異。

CRAG上的性能：Walk&Retrieve變體在答案準確性上優于僅使用LLM和基于文本的RAG，同時在虛假答案和無響應率上與之相當。由于CRAG的復雜性較高，Walk&Retrieve的性能略有下降，但仍表現出良好的魯棒性。

參考文獻：Walk&Retrieve: Simple Yet Effective Zero-shot Retrieval-Augmented Generation via Knowledge Graph Walks，https://arxiv.org/pdf/2505.16849v2

本文轉載自??大模型自然語言處理?? 作者：余俊暉

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

RAG

LLM

知識圖譜

已于2025-5-30 06:44:05修改

贊

回復

舉報

熱門內容榜 ? 最近上榜

回復

相關推薦

基于圖增強的大模型可控生成框架

kcoufee ? 3230瀏覽 ? 0回復
通過檢索增強生成(RAG) 增強LLM的實戰演練

51CTO內容精選 ? 3682瀏覽 ? 0回復
簡單策略解決CTR模型訓練一輪過擬合問題

海因斯DK ? 5160瀏覽 ? 0回復
解決大型多模態模型的幻覺問題，新方法AITuning助力AI更可靠

AI論文解讀 ? 2970瀏覽 ? 0回復
iText2KG：顯著降低LLM構建知識圖譜時的幻覺現象

大語言模型論文跟蹤 ? 3155瀏覽 ? 0回復
增強問答文本檢索的排序（RAG）模型，你學會了嗎？

AI論文解讀 ? 3842瀏覽 ? 0回復
RAG高級優化：基于問題生成的文檔檢索增強

恰似驚鴻 ? 3279瀏覽 ? 0回復
一種將RAG、KG、VS、TF結合增強領域LLM性能的框架

PaperAgent ? 3045瀏覽 ? 0回復
先進的多文檔問答（MDQA）框架HiQA：大幅降低區分度低的復雜多文檔RAG的幻覺問題

AI博物院 ? 2719瀏覽 ? 0回復
Extract-Refine-Retrieve-Read (ERRR)：優化大語言模型的RAG（檢索增強查詢）

芝士AI吃魚 ? 2962瀏覽 ? 0回復
基于Agent的金融問答系統：RAG檢索模塊初建成

一起AI技術 ? 2662瀏覽 ? 0回復
基于Agent的金融問答系統：Agent框架的構建

一起AI技術 ? 2403瀏覽 ? 0回復
基于Agent的金融問答系統：RAG的檢索增強之ElasticSearch

一起AI技術 ? 3166瀏覽 ? 0回復
基于Agent的金融問答系統：RAG的檢索增強之上下文重排和壓縮

一起AI技術 ? 2380瀏覽 ? 0回復
HiQA：一種用于多文檔問答的層次化上下文增強RAG

大模型自然語言處理 ? 2407瀏覽 ? 0回復
RAG再進化？基于長期記憶的檢索增強生成新范式-MemoRAG

大模型自然語言處理 ? 2648瀏覽 ? 0回復
怎么解決大模型知識庫的檢索問題，RAG檢索增強之ReRank(重新排序)

AI探索時代 ? 3737瀏覽 ? 0回復
簡單有效的企業多模態RAG問答框架-MuRAR

大模型自然語言處理 ? 2182瀏覽 ? 0回復
關于基于RAG技術的智能客服系統解決方案

AI探索時代 ? 1569瀏覽 ? 0回復

大模型自然語言處理

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學堂

基于KG生成語料增強解決RAG問答幻覺問題的簡單框架-Walk&Retrieve 原創

語料生成

1.基于圖的遍歷

2.知識表示

3.索引

檢索問答

實驗性能

目錄