最新12種GraphRAG技術(shù)全面評測
GraphRAG 是一種擴(kuò)展的 RAG 范式,通過構(gòu)建圖結(jié)構(gòu)來組織背景知識(shí),其中節(jié)點(diǎn)代表實(shí)體、事件或主題,邊代表它們之間的邏輯、因果或關(guān)聯(lián)關(guān)系。它不僅檢索直接相關(guān)的節(jié)點(diǎn),還會(huì)遍歷圖以捕獲相互連接的子圖,從而發(fā)現(xiàn)隱藏的模式。
GraphRAG vs RAG
GraphRAG 是否真的有效,以及在哪些場景下圖結(jié)構(gòu)能為 RAG 系統(tǒng)帶來可衡量的好處?
廈大和港理工提出的GraphRAG-Bench基準(zhǔn)測試框架,旨在全面評估 GraphRAG 模型在分層知識(shí)檢索和深度上下文推理中的表現(xiàn):
實(shí)驗(yàn)部分對 GraphRAG 和傳統(tǒng) RAG 進(jìn)行了全面對比,得出以下結(jié)論:
- 生成準(zhǔn)確性(Generation Accuracy):GraphRAG 在復(fù)雜推理、上下文總結(jié)和創(chuàng)造性生成任務(wù)中表現(xiàn)優(yōu)于 RAG,但在簡單事實(shí)檢索任務(wù)中,RAG 的表現(xiàn)更好或相當(dāng)。
- 檢索性能(Retrieval Performance):GraphRAG 在復(fù)雜問題上顯示出優(yōu)勢,能夠連接分散在不同文本片段中的信息,這對于多跳推理和全面總結(jié)至關(guān)重要。
- 圖復(fù)雜性(Graph Complexity):不同的 GraphRAG 實(shí)現(xiàn)生成的索引圖在結(jié)構(gòu)上存在顯著差異,例如 HippoRAG2 生成的圖更為密集,節(jié)點(diǎn)和邊的數(shù)量遠(yuǎn)超其他框架。
港理工和騰訊優(yōu)圖提出的GraphRAG-Bench更側(cè)重于評估 GraphRAG 在特定領(lǐng)域推理中的表現(xiàn)。該基準(zhǔn)測試包含 1018 個(gè)涵蓋 16 個(gè)學(xué)科的大學(xué)水平問題,涉及多跳推理、復(fù)雜算法編程和數(shù)學(xué)計(jì)算等多種任務(wù)類型。
評估了九種最先進(jìn)的 GraphRAG 方法,包括 RAPTOR、LightRAG、GraphRAG、G-Retriever、HippoRAG、GFM-RAG、DALK、KGP 和 ToG,得出關(guān)鍵結(jié)論:
- GraphRAG 的優(yōu)勢:在復(fù)雜推理和多跳任務(wù)中,GraphRAG 顯著優(yōu)于傳統(tǒng) RAG 方法,尤其是在需要深度上下文理解和邏輯推理的任務(wù)中。
- 任務(wù)類型的影響:GraphRAG 在不同任務(wù)類型中的表現(xiàn)存在差異。例如,在數(shù)學(xué)和倫理學(xué)領(lǐng)域,其表現(xiàn)不如在計(jì)算機(jī)科學(xué)領(lǐng)域。
- 推理能力的提升:GraphRAG 方法不僅提高了生成的準(zhǔn)確性,還顯著提升了模型的推理能力,使其能夠生成更符合邏輯的解釋。
GraphRAG技術(shù)的圖構(gòu)建評估
- RAPTOR的圖構(gòu)建時(shí)間最長,但令牌消耗最少,因?yàn)樗鼉H通過 LLM 生成總結(jié)。
- KGP的圖構(gòu)建時(shí)間較短,但令牌消耗較高。
- GraphRAG和LightRAG的圖構(gòu)建時(shí)間較長,且令牌消耗最多,因?yàn)樗鼈兩闪祟~外的描述信息。
- G-Retriever和HippoRAG的圖構(gòu)建時(shí)間最短,且非孤立節(jié)點(diǎn)比例最高(約 90%),表明它們在圖構(gòu)建質(zhì)量上表現(xiàn)最佳。
GraphRAG技術(shù)知識(shí)檢索評估
- GFM-RAG的索引時(shí)間最短,因?yàn)樗粯?gòu)建傳統(tǒng)的向量數(shù)據(jù)庫。
- RAPTOR的平均檢索時(shí)間最快,因?yàn)槠錁浣Y(jié)構(gòu)能夠快速定位信息。
- HippoRAG和GFM-RAG的檢索時(shí)間較短,分別利用了 GNN 和 PageRank 算法。
- GraphRAG的檢索時(shí)間較長,因?yàn)樗枰蒙鐓^(qū)信息進(jìn)行檢索
https://arxiv.org/pdf/2506.02404
GraphRAG-Bench: Challenging Domain-Specific Reasoning for Evaluating Graph Retrieval-Augmented Generation
https://arxiv.org/pdf/2506.05690
When to use Graphs in RAG: A Comprehensive Analysis for Graph Retrieval-Augmented Generation
本文轉(zhuǎn)載自????PaperAgent??
贊
收藏
回復(fù)
分享
微博
QQ
微信
舉報(bào)

回復(fù)
相關(guān)推薦