RAG范式演進及Agentic-RAG總結綜述 原創
RAG的核心思想是通過實時數據檢索彌補這一缺陷——在生成答案前,系統先從外部數據源(如數據庫、API或互聯網)動態檢索相關上下文,再結合LLM的知識生成更精準、實時的響應。但它們通常在處理動態、多步推理任務、適應性和復雜工作流的協調方面仍然存在不足。
rag三大組件
- 檢索器(Retriever):從外部數據源(如向量數據庫、知識圖譜或網頁)中搜索與查詢相關的信息。相關技術:如BM25關鍵詞匹配、密集向量搜索等。
- 增強器(Augmenter):對檢索結果進行篩選、排序和整合,提取最相關的片段。相關技術:上下文重排序、多跳檢索。
- 生成器(Generator):將增強后的上下文與LLM的預訓練知識結合,生成自然語言回答。確保回答連貫且忠實于檢索內容,避免出現幻覺。
RAG范式演進
RAG范式的對比
Naive RAG:基礎實現
Naive RAG是RAG范式的最初實現,其核心思想是通過簡單的關鍵詞檢索來增強生成模型的能力。這種方法依賴于TF-IDF、BM25等傳統的檢索技術,從靜態數據集中獲取文檔,并將其用于生成模型的輸入。
優點:
- 簡單易實現:由于依賴簡單的關鍵詞匹配,Naive RAG易于實現。
- 快速部署:適合需要快速上線的場景。
缺點:
- 缺乏上下文感知:由于僅依賴詞匯匹配,無法捕捉查詢的語義細微差別。
- 輸出碎片化:生成的響應可能不連貫或過于通用。
- 可擴展性問題:在處理大規模數據集時表現不佳。
Advanced RAG:語義增強
為了克服Naive RAG的局限性,Advanced RAG引入了語義理解和增強的檢索技術。Advanced RAG使用密集向量搜索模型(如Dense Passage Retrieval, DPR)和神經排序算法來提高檢索的精確度。
關鍵特性:
- 密集向量搜索:通過將查詢和文檔表示在高維向量空間中,實現更好的語義對齊。
- 上下文重排:使用神經模型重新排序檢索到的文檔,優先考慮最相關的信息。
- 多跳檢索:支持跨多個文檔的推理,適用于復雜查詢。
適用場景:
- 高精度需求:如研究綜合和個人化推薦。
Modular RAG:模塊化設計
Modular RAG代表了RAG范式的最新發展,強調靈活性和定制化。這種系統將檢索和生成管道分解為獨立的、可重用的組件,允許針對特定領域進行優化和任務適應。
創新點:
- 混合檢索策略:結合稀疏和密集檢索方法,以最大化不同查詢類型的準確性。
- 工具集成:可以集成外部API、數據庫或計算工具來處理專門任務。
- 可組合管道:允許獨立替換、增強或重新配置檢索器、生成器和其他組件。
適用場景:
- 復雜多領域任務:如金融分析和個性化推薦。
Graph RAG:圖結構整合
Graph RAG通過整合圖結構數據來擴展傳統的RAG系統。這些系統利用圖數據中的關系和層次結構來增強多跳推理和上下文豐富。
特點:
- 節點連接性:捕捉實體之間的關系。
- 層次知識管理:通過圖結構處理結構化和非結構化數據。
- 上下文豐富:通過圖路徑增加關系理解。
適用場景:
- 結構化數據任務:如醫療診斷和法律研究。
Agentic RAG:自主代理
Agentic RAG代表了一種范式轉變,通過引入能夠動態決策和優化工作流的自主代理來實現更高層次的靈活性和適應性。與靜態系統不同,Agentic RAG采用迭代細化和自適應檢索策略來處理復雜的實時和多領域查詢。
關鍵特性:
- 自主決策:代理根據查詢復雜性獨立評估和管理檢索策略。
- 迭代細化:通過反饋循環提高檢索準確性和響應相關性。
- 工作流優化:動態協調任務,提高實時應用的效率。
適用場景:
- 動態適應性強:如客戶支持和財務分析。
Agentic RAG
Agentic RAG概覽
一、Agentic RAG的核心模式
- 反思
- 定義:智能體評估自己的決策和輸出,識別錯誤和需要改進的領域。
- 主要優勢:
a.啟用迭代結果改進。
b.提高多步推理任務的準確性。
- 示例:在醫療診斷系統中,智能體根據檢索到的數據進行迭代反饋,以完善診斷。
反思模式
2. 規劃
- 定義:智能體創建結構化的工作流和任務序列,以高效解決問題。
- 主要優勢:
a.通過分解任務,促進多步推理。
b.通過優化任務優先級,減少計算開銷。
- 示例:金融分析系統規劃數據檢索任務,以評估風險并提供建議。
規劃模式
3. 工具使用
- 定義:智能體與外部工具、API和知識庫交互,以檢索和處理數據。
- 主要優勢:
a.擴展系統的能力,超越預訓練知識。
b.通過整合外部資源,實現特定領域的應用。
- 示例:法律助理智能體從合同數據庫中檢索條款,并應用特定領域的規則進行合規性分析。
工具使用模式
4. 多智能體協作
- 定義:多個智能體協作,通過分工和共享信息及結果來解決復雜任務。
- 主要優勢:
a.高效處理大規模和分布式問題。
b.結合專業智能體的能力,獲得更好的結果。
- 示例: 在客戶支持中,智能體協作以從常見問題解答(FAQ)中檢索知識、生成響應并提供后續服務。 LawGlance通過利用多智能體工作流簡化法律研究,檢索相關文件,分析信息,并提供精確的法律見解。它整合了Crew AI、LangChain和Chroma,以檢索法律文件、進行網絡搜索,并提供針對用戶查詢的簡潔、準確的答案。
多智能體協作模式
小結:這些模式構成了Agentic RAG系統的核心,使它們能夠動態適應任務需求,通過自我評估改進決策,利用外部資源進行特定領域的推理,通過協作處理復雜、分布式的工作流。
二、Agentic RAG系統的分類
Agentic檢索增強型生成(RAG)系統涵蓋了各種架構和工作流,每種都針對特定任務和復雜程度進行了定制。
1. 單智能體RAG
- 核心思想:由單個自主智能體管理檢索和生成過程。
- 工作流程:
- 向智能體提交查詢。
- 智能體從外部來源檢索相關數據。
- 對數據進行處理并合成回復。
- 優點:
- 對于基本用例,架構簡單。
- 易于實現和維護。
- 局限性:
- 可擴展性有限。
- 對于多步推理或大型數據集效果不佳。
2. 多智能體RAG
- 核心思想:一組智能體協作執行復雜的檢索和推理任務。
- 工作流程:
- 智能體動態劃分任務(例如,檢索、推理、合成)。
- 每個智能體專門負責特定的子任務。
- 將結果匯總并合成為連貫的輸出。
- 優點:
- 對于分布式、多步任務表現更佳。
- 模塊化程度更高,可擴展性更強。
- 局限性:
- 隨著智能體數量的增加,協調復雜度上升。
- 智能體之間存在冗余或沖突的風險。
3. 分層智能體RAG
- 核心思想:將智能體組織成層次結構,以便更好地進行任務優先級排序和委派。
- 工作流程:
- 頂層智能體在較低層級智能體之間協調子任務。
- 每個較低層級智能體處理流程中的特定部分。
- 結果在較高層級迭代優化并整合。
- 優點:
- 對于大型復雜任務具有可擴展性。
- 模塊化設計便于實現專業化。
- 局限性:
- 需要復雜的協調機制。
- 在層級結構的較高層級可能出現瓶頸。
4. 糾錯智能體RAG
- 核心思想:通過反饋循環使智能體能夠迭代評估和優化其輸出。
- 工作流程:
- 智能體生成初始回復。
- 一個評判模塊評估回復是否存在錯誤或不一致之處。
- 智能體根據反饋優化回復。
- 重復步驟2 - 3,直到輸出達到質量標準。
- 優點:
- 通過迭代改進實現高準確性和可靠性。
- 對于容易出錯或高風險任務很有用。
- 局限性:
- 計算開銷增加。
- 反饋機制必須精心設計,以避免無限循環。
5. 自適應智能體RAG
- 核心思想:根據任務要求動態調整檢索策略和工作流程。
- 工作流程:
- 智能體評估查詢及其上下文。
- 根據可用數據和用戶需求實時調整檢索策略。
- 使用動態工作流程合成回復。
- 優點:
- 對于各種任務和動態環境具有高度靈活性。
- 提高上下文相關性和用戶滿意度。
- 局限性:
- 設計強大的自適應機制具有挑戰性。
- 實時調整會帶來計算開銷。
6. 基于圖的智能體RAG
基于圖的RAG系統通過整合基于圖的數據結構進行高級推理,擴展了傳統的RAG。
6.1 Agent - G:用于圖RAG的智能體框架
- 核心思想:使用圖知識庫和反饋循環,動態地將任務分配給專門的智能體。
- 工作流程:
- 從圖知識庫中提取關系(例如,疾病與癥狀的映射)。
- 用來自外部來源的非結構化數據進行補充。
- 使用評判模塊驗證結果并迭代改進。
- 優點:
- 結合了結構化和非結構化數據。
- 對于復雜任務具有模塊化和可擴展性。
- 通過迭代優化確保高準確性。
6.2 GeAR:用于RAG的圖增強智能體
- 核心思想:通過圖擴展技術和基于智能體的架構增強RAG系統。
- 工作流程:
- 擴展與查詢相關的圖,以更好地理解關系。
- 利用專門的智能體進行多跳推理。
- 將圖結構和非結構化信息合成為回復。
- 優點:
- 在多跳推理場景中表現出色。
- 提高深度上下文任務的準確性。
- 能夠動態適應復雜的查詢環境。
7. 智能體文檔工作流(ADW)
智能體文檔工作流(ADW)通過利用智能體自動化以文檔為中心的流程,對傳統的檢索增強生成(RAG)系統進行了擴展。
工作流程
- 文檔解析與結構化:
從諸如發票或合同等文檔中提取結構化數據。
- 狀態維護:
- 在多步驟工作流中跟蹤上下文,以確保一致性。
- 知識檢索:
- 從外部來源或特定領域的數據庫中檢索相關參考信息。
- 智能體編排:
- 應用業務規則,進行多步推理,并協調外部應用程序編程接口(API)。
- 可執行輸出生成:
- 生成針對特定用例定制的結構化輸出(例如,報告或摘要)。
智能體RAG框架的對比分析
傳統RAG、智能體RAG以及智能體文檔工作流(ADW)。該分析突出了它們各自的優勢、劣勢及最適用場景,為其在各種不同用例中的適用性提供了寶貴見解。
三種架構框架進行了全面的對比分析
關鍵要點
- 傳統RAG最適合需要基本檢索和生成能力的較簡單任務。
- 智能體RAG在多智能體協作推理方面表現出色,適用于更復雜的多領域任務。
- 智能體文檔工作流(ADW)為企業級應用(如合同分析和發票處理)提供定制化的、以文檔為中心的解決方案。
參考文獻:
Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG,https://arxiv.org/abs/2501.09136
本文轉載自公眾號大模型自然語言處理 作者:余俊暉
原文鏈接:??https://mp.weixin.qq.com/s/yiHoNn8UH-IQBZN2Ec13qw???
