RAG 的盡頭是 Agent？原創

玄姐聊AGI

發布于 2024-8-2 12:49

瀏覽

0收藏

1、大模型的痛點

大模型技術席卷全球，為日常工作和生活帶來便利，但也面臨時效性、準確性等問題。如何提升大模型的性能？解決其挑戰？構建高級應用？成為重要待解決問題。

RAG 的盡頭是 Agent？ -AI.x社區

RAG（檢索增強生成）技術通過信息檢索和文本生成，顯著提升了大模型的性能。但 RAG 也存在局限性，比如：數據依賴、檢索效率等。如何解決這些痛點？如何進一步提升 RAG 性能？是本文剖析的重點。

2、RAG 的痛點

Naive RAG 通過檢索和生成，提升大模型在問答、智能助手等任務上的性能。但 Naive RAG 難以處理復雜問題或大型文檔集，舉例如下：

RAG 的盡頭是 Agent？ -AI.x社區

簡單問題："特斯拉的主要風險因素是什么？" 和 "作者在 YC 期間做了什么？" 等問題，Naive RAG 可以給出準確答案。

復雜問題："總結 XXX 公司年度報告"、"比較開發者 A 和 B 貢獻" 或 "分析滴滴公司風險" 等問題，Naive RAG 可能無法提供滿意結果。

針對復雜問題，我們需要探索更高級 RAG 解決方案。

RAG 的盡頭是 Agent？ -AI.x社區

3、From RAG to Agent

Naive RAG（基于檢索的增強生成）應用主要是在整合自身知識庫的基礎上，提升大型模型的性能，以產出更精準、即時和豐富的行業內容或定制化信息。然而，這種應用仍限于內容生成的領域。若要人工智能像一位“目標導向”的高效工作者一樣，自主選擇多種工具，與不同系統互動合作，直至完成最終任務，那么我們就需要從 RAG 升級至 Agent 模式。

以下是 RAG 向 Agent 轉變的描述：

RAG 的盡頭是 Agent？ -AI.x社區

從 RAG 到 Agent 的演進，并非完全摒棄 RAG，而是在其基礎上拓展以下幾層功能：

多輪對話能力：與用戶進行更深層次的交流，準確把握用戶需求。
查詢/任務規劃層：理解和規劃復雜的查詢與任務流程。
外部工具接口：利用外部工具來完成特定任務。
反思機制：對執行結果進行反思、總結和評估。
記憶功能：記錄用戶交互歷史，以提供更加個性化的服務。

通過這些功能的增強，Agent 不僅能應對復雜任務，還能在多變的環境中靈活應對。與 RAG 相比，Agent更專注于完成特定任務，并更注重與現有系統的融合。它不僅理解語言，還能在現實世界或數字系統中采取行動。Agent 不僅能執行復雜的多步驟任務，比如；信息檢索、數據處理，還能無縫接入各種系統和 API 接口，訪問用戶數據，與數據庫互動。

人類之所以獨特，很大程度上是因為我們會使用工具。同樣，作為智能體的Agent 也能借助外部工具，處理更為復雜的任務。比如：Agent 能夠利用圖表生成工具制作在線圖表，使用天氣查詢工具獲取天氣信息。因此，Agent 是真正釋放大模型潛能的關鍵。

因此，我們的大模型應用也將從 RAG 邁向 Agent，可以說，Agent 是 RAG 發展的必然歸宿。