25種RAG架構大揭秘:AI項目如何選型? 原創 精華
在當今的AI時代,你是否想過,如果AI能夠每次都從全球知識中精準地提取完美答案,那會是怎樣的體驗?檢索增強生成(Retrieval-Augmented Generation,簡稱RAG)正是實現這一目標的幕后英雄。從ChatGPT引用來源的能力到企業AI掃描數千份文件,RAG為語言模型提供了現實世界的根基。然而,RAG并非“一刀切”的解決方案。隨著時間的推移,AI研究人員設計了多種專門的RAG架構,每種架構都針對不同的現實世界瓶頸進行了優化,比如幻覺、響應延遲、較差的現實根基或有限的上下文。那么,面對25種不同的RAG類型,你該如何選擇呢?今天,我們就來深入剖析這25種RAG架構,幫助每一位AI工程師找到最適合的方案。
1. 標準RAG:基礎中的經典
先從最經典的開始。標準RAG結合了檢索器和生成器。檢索器從知識庫中搜索相關文檔,而生成器(比如GPT-4)則利用這些證據來生成回答。
核心特點
- 將文檔分解為可管理的塊,便于檢索。
- 只檢索最相關的信息,以供LLM使用。
- 適合實時響應(約1-2秒)。
應用場景
- 客戶支持機器人從常見問題文檔中實時獲取答案。
實踐項目
法律文件問答系統
標準RAG在需要提取相關文本塊并生成回答的領域表現出色,非常適合法律問答。你可以構建一個聊天機器人,通過檢索案例法、政策或合同來回答用戶問題。使用FAISS或Weaviate等向量數據庫存儲分塊的法律文件。標準RAG保持架構簡潔:檢索→生成,沒有多余的裝飾。它非常適合法律領域的回答,結構和引用比推理鏈更重要。
企業內部知識助手
標準RAG非常適合為小型到中型團隊構建快速、簡潔的內部幫助臺助手。它可以搜索維基、人力資源文檔、入職指南和技術標準操作程序。由于上下文大多是事實性和直接的,基本的檢索+生成就能覆蓋80%的用例。標準RAG輕量級、可解釋,不需要額外的代理工具或重新排序。它非常適合MVP和快速內部工具,速度和簡潔性至關重要。
2. 糾正型RAG:編輯介入的修正
你是否曾覺得AI的回答“差點就對了”?糾正型RAG就是為了解決這個問題。它通過反饋循環來優化回答,從自身的錯誤或用戶反饋中學習。
核心特點
- 多次迭代修正。
- 通過提高精確度來提升用戶滿意度。
- 反饋驅動的生成循環。
應用場景
- 在線學習平臺根據學生或教師的反饋自動修正生成的測驗答案。
實踐項目
醫療聊天機器人與醫學文檔檢索
在醫療領域,幻覺可能會帶來危險。糾正型RAG增加了一個驗證層,以降低風險。這個項目構建了一個醫療助手,從臨床指南中檢索信息,然后檢查生成的回答是否符合事實。糾正型RAG有助于標記并糾正誤導性的LLM輸出,確保回答基于真實的醫學來源。這對于患者常見問題或提供者支持工具來說是完美的,其中精確性和信任是不可妥協的。通過在生成后重新檢查和修訂輸出,系統避免了過度自信和錯誤信息。
面向零售投資者的金融咨詢助手
金融建議必須準確且有根據。糾正型RAG強制執行這一標準。在這個項目中,用戶詢問投資問題,助手從SEC文件、金融新聞和ETF文檔中檢索信息。LLM生成初步回答,糾正型RAG流程使用檢索到的事實進行批評和編輯。這種雙重檢查機制有助于減少投機領域常見的幻覺。這對于在受監管行業中建立非專家用戶的信任非常有幫助。
3. 推測型RAG:快速起草,智能驗證
可以將其視為“先畫草圖,再精心潤色”的策略。推測型RAG使用一個小型、快速的模型來起草回答,然后使用一個更大的模型來驗證和優化它們,就像一個初級-高級編輯團隊一樣。
核心特點
- 并行起草提高速度。
- 通用模型確保最終質量。
- 在延遲和準確性之間實現高效平衡。
應用場景
- 需要快速且準確無誤的新聞摘要機器人。
實踐項目
SmartSpec:電商產品描述生成器
構建一個可擴展的工具,使用推測型生成快速起草吸引人的產品描述,然后根據規格和目錄驗證準確性。對于電商平臺來說,速度和創造力固然重要,但準確性絕對不能妥協。推測型RAG允許使用較小、較快的模型來起草產品內容,而更強大的驗證器則確保與檢索到的規格保持事實一致性。這不僅加快了海量產品目錄的上市時間,還保持了用戶信任和合規性。它非常適合在推出多語言列表時平衡規模和質量,確保LLM不會憑空捏造產品特性或違反平臺政策。
AutoAssist:經過驗證的客戶支持郵件回復器
這是一個由人工智能驅動的助手,能夠快速起草支持回復,并通過驗證內部工單數據來確保事實準確性。為處理高工單量的支持團隊開發一個快速響應的客戶郵件回復工具。推測型模型可以實時起草禮貌且信息豐富的回復,而驗證模型則使用相關的工單歷史記錄或公司政策進行修正。這種方法在提升客服代表工作效率的同時,也不會損害品牌聲音或事實準確性。推測型RAG非常適合在需要人類速度但機器可靠性的情況下使用,它能夠實現快速且可驗證的生成,是半自動化人機協作系統的理想選擇。
4. 融合型RAG:多源匯聚,精準作答
為什么只依賴單一來源,而不匯聚多方智慧呢?融合型RAG從多個檢索器和數據源中提取信息,并將結果融合在一起。這不僅增加了知識的多樣性,還提高了答案的準確性和可靠性。
核心特點
- 知識輸入來源多樣化。
- 動態適應不同的檢索策略。
- 減少因單一來源故障或偏見而導致的問題。
應用場景
- 金融分析工具,整合來自監管文件、市場新聞和專家意見的見解。
實踐項目
跨平臺法律咨詢助手
創建一個能夠從多個平臺(包括法院裁決、法律數據庫和行業新聞網站)中提取法律信息的人工智能助手。該系統應能夠無縫整合這些不同的數據源,并根據具體問題生成準確的法律建議,確保助手能夠處理涉及復雜法律場景的問題。該系統的強大之處在于將這些來源結合起來,產生連貫且精確的答案。
多語言客戶支持聊天機器人
開發一個能夠從多種語言和文化背景中提取信息以回答問題的客戶支持聊天機器人。融合型RAG方法將使聊天機器人能夠無縫地從全球支持數據庫、知識文章和本地化資源中提取信息,將這些不同的部分整合起來,以客戶首選的語言和文化相關的方式回答問題。這將確保在多元化的客戶群體中,回答更加準確且具有上下文相關性。
5. 代理型RAG:自主知識探索者
事情開始變得有趣了。代理型RAG使用代理——獨立的決策者——根據實時策略動態地規劃、檢索和生成內容。
核心特點
- 基于模塊的代理系統。
- 并行任務執行。
- 深入理解用戶意圖。
應用場景
- 能夠處理復雜、多步驟科學查詢的人工智能研究助手。
實踐項目
自主政策研究助手
構建一個幫助政策分析師生成報告的代理,它能夠自主地從立法數據庫、學術研究論文和當前新聞文章中檢索和比較數據。該代理會迭代地推理矛盾之處,根據可信度對來源進行對齊,并生成帶有引用來源的政策簡報。該代理會規劃子任務——比如從不同領域獲取數據、比較時間線和檢查來源偏見——然后生成摘要。
初創公司競爭情報代理
創建一個持續監控競爭對手網站、新聞稿、融資消息、招聘啟事和社會媒體的人工智能代理。它將這些更新綜合成每周的市場分析簡報。該代理自主設置檢索目標(例如,“尋找新的產品發布”),獲取最新數據,總結更新,并使用RAG評估策略變化。
6. 自我型RAG:反思型思考者
自我型RAG并不總是求助于知識庫。相反,它首先使用自己的先前輸出作為檢索基礎,然后再尋求外部幫助。
核心特點
- 使用內部輸出進行迭代細化。
- 提高連貫性和一致性。
- 減少不必要的檢索。
應用場景
- 需要在各章節中保持敘事連貫性的長篇故事創作人工智能。
實踐項目
學術研究評論助手
構建一個幫助學生或研究人員審查學術論文的助手。該代理檢索相關作品,反思證據是否支持或反駁論文的主張,并生成評論或摘要。該代理需要自我評估檢索到的來源是否足夠相關或矛盾,并據此細化其輸出。
人工智能政策的倫理風險分析器
開發一個評估提議的人工智能倫理政策(例如,面部識別規則)的系統。該代理檢索案例研究、研究和新聞示例,然后反思其使用的證據中的差距或偏見,以進行評估。倫理評估需要細微差別。反思循環允許該代理重新考慮其檢索是否公平地代表了政策問題的雙方,并重新生成具有平衡來源的輸出。
7. 自適應型RAG:每次檢索都智能
并非所有問題都需要檢索。自適應型RAG使用置信度分數來決定何時檢索,何時不需要。
核心特點
- 使用內部模型信號觸發檢索。
- 平衡記憶與外部知識。
- 使用“誠實探針”避免幻覺。
應用場景
- 虛擬醫療助手僅在復雜病例時咨詢數據庫,而使用內部記憶回答簡單問題。
實踐項目
企業幫助臺優化器
構建一個智能幫助臺系統,用于內部IT團隊,根據用戶的角色和查詢類型調整其檢索方法。例如,當開發運維工程師詢問有關容器錯誤的問題時,觸發技術日志/文檔檢索;而新員工詢問有關VPN訪問的問題時,則觸發常見問題和入職資料。自適應型RAG檢測用戶上下文,并相應地調整檢索層——對于常規查詢,拉取最少的用戶特定文檔;對于復雜問題,則拉取更深入的技術工件。
自適應臨床決策支持工具
創建一個為醫生量身定制的工具,根據患者癥狀的嚴重性和模糊性調整其醫療信息檢索。對于常規診斷,它從臨床指南中拉取信息;對于模糊或罕見病例,它擴展到學術研究、臨床試驗和專家訪談。不同病例需要不同深度的證據。自適應型RAG確保檢索具有上下文敏感性——足夠智能,能夠根據需要擴展或縮小信息范圍。
8. REFEED(檢索反饋):無需訓練即可微調
REFEED通過優化檢索而非重新訓練模型來提升回答質量。
核心特點
- 根據檢索后信號重新排序答案。
- 結合檢索前和檢索后內容。
- 迭代改進輸出。
應用場景
- 企業搜索引擎通過觀察用戶點擊或高度評價的文檔來持續改進。
實踐項目
智能招聘面試助手
構建一個幫助人力資源專業人士進行結構化面試的人工智能工具。當助手提問或回答問題時,它從用戶更正(例如,“這不是正確的政策”或“這是過時的”)中學習,并相應調整未來的檢索——浮出更相關的內部文件、政策更新或候選人評估標準。該系統無需全面重新訓練;它只是根據反饋更新檢索和重新排序信息的方式。隨著時間的推移,助手變得更好,能夠與每個人力資源團隊的獨特風格和政策變化保持一致。
具有用戶更正功能的自適應編碼助手
創建一個編碼助手,它從論壇、文檔和過往項目中檢索信息,以建議代碼片段和架構模式。當開發人員對建議進行負面評價或重寫時,助手使用該反饋來調整其未來的檢索行為——優先考慮更新的框架、更高質量的示例或企業特定的代碼。它無需重新訓練LLM即可實現快速個性化。檢索行為通過反饋演變,以一種輕量級、非侵入式的方式逐步改進。
9. REALM:檢索感知型語言建模
REALM是一種混合型生物——在預訓練期間使用掩碼語言建模訓練檢索器。
核心特點
- 在訓練期間使用維基百科規模的語料庫。
- 使用最大內積搜索(MIPS)訓練檢索器。
- 非常適合開放域問答。
應用場景
- 能夠使用潛在文檔表示“預先思考”答案的搜索感知型助手,例如谷歌助手。
實踐項目
基于新聞檔案的長篇傳記生成器
創建一個能夠通過檢索和整合新聞檔案、采訪和文章中的相關文檔來生成公眾人物詳細傳記的助手。以REALM的方式對其進行訓練,使其能夠學習對人物故事重要的檢索模式——時間順序、事件重要性以及名稱消歧。該項目從預訓練模型中受益,使其能夠識別不僅要檢索什么,還要了解檢索到的上下文如何塑造長篇敘事結構——這是REALM專門設計來處理的。
基于領域的醫學問答系統
構建一個針對醫學專業人士的問答系統,該系統使用REALM風格的訓練技術——將從臨床文獻中的檢索深度嵌入模型的語言建模管道。這不僅使其能夠檢索相關研究,還能在回答生成過程中理解其醫學上下文。由于REALM在訓練期間整合檢索,該系統發展出對何時以及如何檢索的細微理解,使其非常適合像醫學這樣受監管的領域,其中證據必須具有上下文相關性和精確性。
10. RAPTOR:基于樹的推理
想象一下思維導圖——這就是RAPTOR。它將內容聚類成一個分層樹,用于多級檢索——頂層是寬泛的主題,底層是具體細節。
核心特點
- 高效回答分層、復雜問題。
- 提供樹遍歷或折疊樹模式。
- 在處理細微任務時優于平面檢索。
應用場景
- 法律研究機器人通過從抽象到詳細的分支檢索法規和具體案例細節。
實踐項目
復雜金融風險評估代理
構建一個幫助分析師評估投資風險的人工智能代理,通過將查詢分解為多個子因素(例如,市場波動、監管變化、公司基本面)來引導檢索。RAPTOR沿著每條路徑(例如,央行新聞、行業報告、財務報表)引導檢索,然后將它們綜合成一個總體風險評估。金融風險是多方面的,從并行證據分支進行推理受益匪淺。RAPTOR確保在最終綜合之前深入探索每個組成部分。
人工智能辯論教練
創建一個幫助辯論學生構建論點的工具,通過將論題(例如,“人工智能應該受到監管”)分解為子主題,如倫理影響、法律框架和經濟影響。該系統為每個分支檢索論點和反論點,幫助學生準備平衡且高質量的辯論要點。辯論準備需要在多個往往是相反的維度上進行推理。RAPTOR的樹結構檢索和推理幫助代理構建更強的多視角論點。
11. REVEAL:推理+視覺
REVEAL是一種針對視覺語言任務的RAG方法——想想GPT-4V。它將推理、任務對齊思維和現實世界根基相結合,以減少視覺查詢中的幻覺。
核心特點
- 基于現實世界的視覺事實。
- 決策過程透明且可解釋。
- 少樣本友好。
應用場景
- 用于機械系統的視覺故障排除機器人,通過手冊和日志“查看”機器部件并建議修復。
實踐項目
制造業視覺合規檢查器
構建一個能夠將產品設計或包裝圖像與監管和品牌合規性檢查表進行審計的人工智能助手。它提取視覺特征(例如,警告標簽、布局、標志放置),檢索有關相關標準(例如FDA或ISO)的文檔,然后標記問題或推薦修復。該項目需要在視覺和文本證據之間進行推理。該代理必須分析圖像,并將其發現與檢索到的監管指南對齊,這是REVEAL的強項。
基于圖表學習的教育導師
創建一個智能導師,幫助學生理解生物學、物理學或地理學中的視覺概念。當展示圖表(例如,水循環或電路板)時,它檢索相關的教科書內容,逐步解釋視覺內容,并回答后續問題。從圖表中學習需要系統能夠解釋視覺元素,并將其與解釋性文本聯系起來。REVEAL使這種視覺-文本融合成為可能,以支持豐富的教育對話。
12. REACT:先思考,再行動
REACT(推理+行動)為模型提供了一種帶有可操作步驟的思考鏈方法,非常適合解決問題。它使代理能夠通過推理逐步處理查詢,然后通過調用搜索API、計算器、數據庫或代碼執行環境等工具來“行動”。REACT的獨特之處在于檢索并非被動的——它變成了一個主動的、由決策驅動的過程,代理決定何時檢索、檢索什么以及如何在上下文中使用它。
核心特點
- 保持過去步驟的記憶。
- 通過邏輯推理行動。
- 增強透明度和可靠性。
應用場景
- 通過生成假設、檢查文檔和逐步修改代碼來調試的編碼副駕駛。
實踐項目
自主商業團隊數據分析員
構建一個幫助商業分析師回答數據問題(例如,“為什么第三季度在歐洲、中東和非洲地區的收入下降了?”)的人工智能代理。它通過推理查詢,從儀表板中拉取相關指標,檢索會議記錄或客戶關系管理條目,運行計算,并以結構化的方式呈現帶有視覺解釋的回答。該代理需要在推理(“我需要歐洲、中東和非洲地區的收入趨勢”)和行動(“查詢銷售數據庫”)之間交替,使其成為REACT思考-行動循環的完美契合。
法律研究和起草助手
創建一個幫助律師起草論點或分析案例的法律人工智能。它可以檢索相關的法規或先前的判決,通過先例進行推理,突出矛盾,并生成法律簡報的大綱或初稿。法律任務往往需要代理根據不斷演變的上下文采取智能行動——搜索數據庫、解釋條款以及構建邏輯論點。REACT的迭代決策循環支持這種復雜性。
13. 記憶型RAG:構建記憶,擊敗延遲
記憶型RAG旨在提高速度和效率。它隨著時間的推移構建一個檢索記憶緩存,記住以前查詢中有用的文檔。與其每次都重新查詢整個語料庫,系統會記住有用的先前檢索,并重新使用高置信度的塊,以節省時間并提高響應一致性。這使得代理能夠在用戶反復互動或上下文跨輪次延續時,以更低的延遲和更好的會話連續性運行。
核心特點
- 記憶先前的檢索。
- 降低延遲和計算成本。
- 非常適合重復或類似的問題。
應用場景
- 客戶服務機器人使用以前訪問過的數據回答重復的賬單或政策相關問題。
實踐項目
持續學習人工智能教練
構建一個幫助用戶掌握復雜學科(如人工智能、法律或醫學)的個人學習助手。該助手記住以前會話中檢索到的解釋、關鍵概念以及誤解的話題,并利用這些上下文為未來的回答或測驗學習者提供個性化服務。由于學習之旅是逐步的,該代理受益于重新使用早期的見解,而不是從頭開始檢索一切。這使得互動更快,并且更符合每個用戶的學習路徑。
忙碌領導的執行簡報助手
創建一個為高管總結正在進行的計劃、過去的決策以及新更新的智能簡報工具。當被問及“泰坦計劃的狀態如何?”時,它利用以前的總結和檢索回憶即時回答。高管重視速度和一致性。記憶型RAG使系統能夠回憶以前會話中的上下文豐富的塊,確保更快的響應并減少重復。
14. 圖形RAG:連接點
大多數RAG系統檢索線性文本塊。圖形RAG通過連接實體和概念構建知識圖譜,使模型能夠在結構化的關系上進行推理。
核心特點
- 知識的結構化表示。
- 支持在復雜關系上進行推理。
- 增強可解釋性。
應用場景
- 通過概念圖在法規、案例法和條例之間導航的法律人工智能助手。
15. 雙模RAG:兩種優勢的結合
雙模RAG結合了兩個生成器或檢索器,以提高輸出質量。這些可以是不同的模型,也可以是使用不同提示或檢索基礎的相同模型。
核心特點
- 模型多樣性減少幻覺。
- 增強魯棒性。
- 鼓勵輸出之間達成一致。
應用場景
- 比較并交叉驗證使用兩個不同醫學知識庫的建議的醫療聊天機器人。
16. 上下文感知型RAG:個性化且持久
這種RAG變體記住你的上下文——過去的對話、用戶行為和偏好——并據此調整其檢索。
核心特點
- 對話記憶。
- 基于用戶歷史的檢索。
- 個性化回答。
應用場景
- 根據學習者過去的問題和錯誤調整解釋的人工智能導師。
17. 集成型RAG:讓專家來決定
為什么只選擇一個模型,而你可以使用集成呢?集成型RAG將任務路由到多個RAG管道,選擇或組合最佳輸出。
核心特點
- 結合不同RAG模型的優勢。
- 基于投票或排名的答案選擇。
- 魯棒的回退機制。
應用場景
- 需要在速度、成本和精度之間取得平衡的企業人工智能系統,通過在快速和徹底的管道之間切換。
18. 多模態RAG:超越文本
多模態RAG不僅檢索文本,還將其知識庫擴展到圖像、視頻、音頻或表格數據。
核心特點
- 跨模態檢索。
- 需要多模態編碼器(例如CLIP、Flamingo)。
- 解鎖跨領域應用。
應用場景
- 從藝術圖像、音頻導游和歷史文本中提取信息以回答訪客問題的虛擬博物館導游。
19. 聯邦型RAG:私密且分布式
當數據分散(例如醫院或銀行)時,聯邦型RAG可以從本地來源檢索信息,而無需集中數據。
核心特點
- 保護隱私的架構。
- 支持邊緣和離線模式。
- 本地化上下文檢索。
應用場景
- 跨醫院醫療診斷工具,訪問存儲在各個服務器上的記錄,同時不違反隱私法規。
20. 在線型RAG:實時學習
在線型RAG通過持續攝取實時文檔或事件來動態更新其知識庫。
核心特點
- 動態攝取管道。
- 近乎實時的檢索能力。
- 防止信息過時。
應用場景
- 股票市場分析師能夠在幾秒鐘內檢索和總結最新的文件、推文和新聞警報。
21. 模塊化RAG:即插即用架構
模塊化RAG旨在提供靈活性,允許獨立替換每個組件(檢索器、重排序器、生成器、路由器)。
核心特點
- 不同任務可互換的模塊。
- 促進可重用性和實驗性。
- 更易于調試和優化。
應用場景
- 通過調整模塊為法律、教育和醫療保健領域定制檢索管道的人工智能平臺。
22. 多跳RAG:跨步驟推理
有些問題需要多步推理。多跳RAG通過多輪檢索來回答——先回答中間的子問題,再返回最終答案。
核心特點
- 遞歸檢索管道。
- 支持復雜任務的分解。
- 在開放域問答中很常見。
應用場景
- 學術研究助手回答分層問題,例如“20世紀70年代英國通貨膨脹的原因是什么,政策制定者如何應對?”
23. 工具集成型RAG:檢索+行動
這種版本將RAG與工具使用能力相結合,允許模型在最終確定回答之前執行操作,例如網絡搜索、計算器功能或數據庫查詢。
核心特點
- 檢索+工具執行循環。
- 動態規劃和代理協調。
- 混合推理和計算。
應用場景
- 查找稅法并動態計算你的退稅金額的人工智能財務顧問。
24. 級聯RAG:分階段檢索
級聯RAG不是一次性檢索所有內容,而是分階段應用檢索,在每一步中使用中間生成器或重排序器來優化結果。
核心特點
- 分層檢索架構。
- 提高密集知識庫的質量。
- 減少無關結果。
應用場景
- 研究機器人從專利數據庫中檢索信息,逐步過濾發明人、類別和出版日期。
25. 異步RAG:并行+事件驅動
最后,異步RAG允許不同組件并行運行或按需觸發——非常適合分布式或多線程應用。
核心特點
- 事件驅動的RAG工作流。
- 并行檢索器/生成器。
- 適合微服務架構。
應用場景
- 在集成開發環境中同時從文檔、源代碼和錯誤日志中檢索信息的人工智能開發助手。
從基礎的標準RAG到動態代理、圖形推理、多模態學習和保護隱私的設置,這25種RAG類型的集合反映了RAG設計空間的快速發展。
那么,接下來你該怎么做呢?
如果你是開發人員、數據科學家或人工智能愛好者:
- 從標準RAG開始,用于開放域問答。
- 嘗試自我型RAG或糾正型RAG以提高質量。
- 如果你的領域復雜,探索圖形RAG或多模態RAG。
- 結合RAG與代理,使用REACT或工具集成型RAG來構建自主系統。
希望這篇文章能幫助你在人工智能項目中找到最適合的RAG架構。
本文轉載自公眾號Halo咯咯 作者:基咯咯
