Agentic RAG 目前最強大的RAG實現方式 原創
1、什么是RAG?
??RAG 作為一種提升生成式 AI 模型表現的框架,通過檢索外部知識源,增強生成內容的準確性與豐富度。AI Agent 則是具備感知、推理、行動和學習能力的自主軟件系統,能在復雜環境中完成任務。二者結合,讓 AI 系統擁有更強大的功能。
. ??傳統 RAG 存在檢索時機難定、文檔質量不佳、易生成錯誤信息等問題。Agentic RAG 系統有效解決了這些痛點,在客戶支持、內容創作、研究輔助、工作流自動化等場景廣泛應用。例如在客戶支持中,它能快速檢索實時數據,精準回應客戶咨詢;內容創作時,依托檢索知識,在專業領域產出高質量內容。
典型的 RAG 應用有兩個相當大的局限性:簡單的 RAG 管道僅考慮一個外部知識源。但是,有些解決方案可能需要兩個外部知識源,而有些解決方案可能需要外部工具和 API,例如網絡搜索。它們是一次性解決方案,這意味著上下文只被檢索一次。對檢索到的上下文的質量沒有任何推理或驗證。
一個流行的框架是ReAct 框架。ReAct 代理可以通過將路由、查詢規劃和工具使用組合成一個實體來處理順序的多部分查詢,同時保持狀態(在內存中)。ReAct = Reason + Act(With LLMs)
該過程涉及以下步驟:
思考:收到用戶查詢后,代理會推斷下一步要采取的行動
動作:代理決定一個動作并執行它(例如,使用工具)
觀察:代理觀察動作的反饋
該過程不斷重復,直到代理完成任務并響應用戶。
2、什么是Agentic RAG?
Agentic RAG就是一種融合了Agent能力的RAG,而Agent的核心能力是自主推理與行動。所以Agentic RAG就是將AI智能體的自主規劃(如路由、行動步驟、反思等)能力帶入到傳統的RAG,以適應更加復雜的RAG查詢任務。
Agentic RAG如何應對這些典型的復雜任務?一起來看。
在不同類型的RAG管道間自主選擇(路由),以適應任務的多樣性:
融合多種類型的RAG管道與數據源,以適應綜合性復雜查詢任務:
與必要的外部工具協作,以增強輸出的準確性:
. ??Agentic RAG 系統包含多種類型。Agentic RAG 路由器依據查詢特性,將任務分配至合適組件,單一路由器適用于簡單場景,多路由器則能處理復雜系統的大量查詢。查詢規劃型 Agentic RAG 可通過智能分解、分布式處理和響應合成,高效處理復雜查詢。
. ??自適應 RAG 根據查詢復雜度選擇處理策略,簡單問題直接生成答案,復雜問題多步驟檢索推理,提高計算效率與回答準確性。主動型糾錯 RAG 引入自我糾錯機制,評估檢索文檔,重寫查詢并結合網絡搜索,提升答案質量。自反射 RAG 具備自我反思和邏輯推理能力,動態檢索并自評輸出,減少幻覺現象。Speculative RAG 利用大小模型分工,小模型起草、大模型核查,實現快速準確回答。Self Route Agentic RAG 讓 LLM 判斷能否回答問題,合理調用長上下文模型,平衡成本與性能。
. ??Agentic RAG 系統憑借其創新架構與強大功能,在 AI 領域取得顯著進展。隨著技術不斷發展,它將在更多領域發揮重要作用,為 AI 創新奠定堅實基礎。
. ?為什么需要Agentic RAG?
Agentic RAG的“智能體”特征主要體現在檢索階段,相對于傳統RAG的檢索,
Agentic RAG更能夠:
??決定是否需要檢索
??自主決策使用哪個檢索引擎
??自主規劃使用檢索引擎的步驟
??評估檢索到的上下文,并決定是否重新檢索
??自行規劃是否需要借助外部工具
. ?Agentic RAG 的應用
?客戶支持:通過訪問實時數據源,自動檢索并提供準確的用戶查詢響應。
?內容創作:生成復雜領域(如法律或醫療)中的上下文豐富的內容,依托于檢索的知識。
?研究輔助:通過自主收集和綜合來自廣泛數據庫的相關材料,幫助研究人員。
?工作流自動化:通過將基于檢索的決策集成到企業流程中,簡化企業運營。
Agentic RAG 架構
與順序式簡單 RAG 架構相比,代理式 RAG 架構的核心是代理。代理式 RAG 架構可以具有各種復雜程度。在最簡單的形式中,單代理 RAG 架構是一個簡單的路由器。但是,您也可以將多個代理添加到多代理 RAG 架構中。本節討論了兩種基本的 RAG 架構。
單代理 RAG(路由器)
最簡單的形式是,agentic RAG 是一個路由器。這意味著您至少有兩個外部知識源,代理決定從哪個源檢索其他上下文。但是,外部知識源不必局限于(矢量)數據庫。您也可以從工具中檢索更多信息。例如,您可以進行網絡搜索,或者您可以使用 API 從 Slack 頻道或您的電子郵件帳戶檢索其他信息。
多代理 RAG 系統
正如您所猜測的,單代理系統也有其局限性,因為它僅限于一個代理,集推理、檢索和答案生成于一體。因此,將多個代理鏈接到多代理 RAG 應用程序中是有益的。
例如,您可以讓一個主代理協調多個專門檢索代理之間的信息檢索。一個代理可以從專有的內部數據源檢索信息。另一個代理可以專門從您的個人帳戶(例如電子郵件或聊天)檢索信息。另一個代理還可以專門從網絡搜索中檢索公開信息。
Agentic RAG 與 普通RAG
雖然 RAG 的基本概念(發送查詢、檢索信息和生成響應)保持不變,但工具的使用對其進行了概括,使其更加靈活和強大。
可以這樣想:普通(原始)RAG 就像在圖書館(智能手機出現之前)回答特定問題。另一方面,Agentic RAG 就像手中拿著一部智能手機,上面有網絡瀏覽器、計算器、電子郵件等。
從原始 RAG 到代理 RAG 的轉變使得這些系統能夠產生更準確的響應、自主執行任務并更好地與人類合作。代理 RAG 的優勢主要在于提高了檢索到的附加信息的質量。通過添加具有工具使用權限的代理,檢索代理可以將查詢路由到專門的知識源。此外,代理的推理能力使檢索到的上下文在用于進一步處理之前能夠進行一層驗證。因此,代理 RAG 管道可以帶來更穩健、更準確的響應。
Agentic RAG 的局限性
然而,任何事物都有兩面性。使用 AI 代理執行子任務意味著要結合 LLM 來完成任務。這帶來了在任何應用程序中使用 LLM 的局限性,例如增加延遲和不可靠性。根據 LLM 的推理能力,代理可能無法充分完成任務(甚至根本無法完成)。重要的是要結合適當的故障模式,以幫助 AI 代理在無法完成任務時擺脫困境。
本文轉載自公眾號數字化助推器 作者:天涯咫尺TGH
