淺看引入智能信息助理提升大模型處理復雜推理任務的潛力-AssisTRAG 原創

大模型自然語言處理

發布于 2024-11-14 15:13

瀏覽

0收藏

AssisTRAG通過集成一個智能信息助手來提升LLMs處理復雜推理任務的能力。該框架由兩個主要組件構成：一個凍結的主語言模型和一個可訓練的助手語言模型。

淺看引入智能信息助理提升大模型處理復雜推理任務的潛力-AssisTRAG-AI.x社區

AssisTRAG與之前的RAG對比

1. 組件

主語言模型（Main LLM）：負責根據提供的信息生成答案。這個模型是固定的，不進行訓練。
助手語言模型（Assistant LLM）：負責信息管理，包括記憶管理和知識管理。這個模型是可訓練的。

可以看出，相比之前的RAG，該框架主要創新點是引入一個Assistant LLM，下面詳細看下助手語言模型功能。

2. AssisTRAG

淺看引入智能信息助理提升大模型處理復雜推理任務的潛力-AssisTRAG-AI.x社區

AssisTRAG主要分為兩個類別來處理復雜任務：記憶管理和知識管理。記憶管理涉及整合和分析來自內部內存的內容，而知識管理則側重于利用外部知識。這兩個主要功能由AssisTRAG的四個核心能力支持：

工具使用（Tool Usage）：從內部記憶和外部知識庫中檢索相關信息。
動作執行（Action Execution）：進行推理、分析信息需求并提取知識。
記憶構建（Memory Building）：記錄從歷史交互中提取的關鍵知識和推理模式。
計劃指定（Plan Specification）：確定在答案生成過程中每個步驟的必要性。

2.1 記憶管理

記憶管理模塊通過存儲和檢索歷史交互來提升主語言模型的性能。有效的記憶管理包括兩個主要過程：捕獲新見解和檢索先前存儲的信息。這兩個過程主要有以下三個能力：

1. Action I: 筆記記錄

筆記記錄功能負責記錄每個歷史交互中的關鍵信息和推理模式。具體來說，給定主語言模型的歷史交互（包括問題、參考答案和生成的答案），助手的任務是將答案背后的關鍵推理過程記入記憶槽中：

這樣，所有先前問題的記憶槽累積起來形成助手的記憶，用于后續的記憶檢索。

作用：通過記錄和存儲歷史交互中的關鍵推理過程，助手能夠在面對類似問題時快速檢索和應用這些推理模式，從而提高回答的質量和效率。

2. Tool I: 記憶檢索器

記憶檢索器利用助手的記憶，根據當前問題檢索歷史上相關的記憶。具體來說，記憶檢索器會檢索與當前問題相關的歷史記憶，并將其表示為：

作用：通過從記憶中檢索相關歷史記憶，助手可以為當前問題提供額外的上下文和信息，幫助主語言模型更好地理解和回答問題。

3. Plan I: 評估檢索記憶的有用性

如果問題是全新的，檢索到的記憶可能不僅無助于回答，還可能負面影響主語言模型的響應。因此，助手需要評估檢索到的記憶是否對當前問題有幫助。具體來說，助手使用一個提示來評估檢索到的記憶是否有助于回答當前問題。只有當答案是肯定的時候，檢索到的記憶才會被提供給主語言模型。

實現：通過一個提示，助手評估檢索到的記憶是否對當前問題有益。如果評估結果是肯定的，這些記憶槽將被提供給主語言模型。

作用：這一計劃確保了只有相關的記憶會被提供給主語言模型，避免了無關或負面的記憶干擾回答的質量。

2.2 知識管理

知識管理涉及以下四個能力：

1. 動作 II：問題分解

功能：將當前問題分解為多個子查詢，以便從不同方面檢索知識。
實現：給定一個問題，動作將其分解為一系列子查詢。例如，問題“音樂家和諷刺作家Allie Goertz寫了一首關于《辛普森一家》角色Milhouse的歌曲，Matt Groening是根據誰的名字命名的？”可以被分解為：

子查詢1：Allie Goertz寫了一首關于《辛普森一家》角色Milhouse的歌曲。
子查詢2：Matt Groening是根據誰的名字命名了Milhouse？

2. 工具 II：知識檢索器

功能：利用子查詢從外部知識庫中檢索相關文檔。
實現：使用子查詢，知識檢索器從外部知識庫中檢索相關文檔，表示為。例如，子查詢1和子查詢2將被用來從維基百科等外部數據庫中檢索與Allie Goertz和Milhouse相關的文檔。

3. 動作 III：知識提取

功能：從檢索到的文檔中提取關鍵知識。
實現：給定問題和檢索到的文檔，動作負責從中提取相關知識。例如，從檢索到的文檔中提取出：

Allie Goertz 是一位美國音樂家和諷刺作家。
Milhouse 是《辛普森一家》中的一個虛構角色，由Matt Groening創造，并以意大利獨裁者Benito Mussolini命名。

4. 計劃 II：評估提取知識的相關性

功能：確保提供給主語言模型的信息準確且相關。
實現：助手通過提示評估提取的知識是否與當前問題相關。只有當提取的知識被認為對回答問題有幫助時，才會將其提供給主語言模型。

2.3 AssisTRAG 訓練

淺看引入智能信息助理提升大模型處理復雜推理任務的潛力-AssisTRAG-AI.x社區

AssisTRAG 的訓練過程分為課程助理學習和強化偏好優化兩個階段。課程學習階段通過逐步增加任務復雜性來提升助手在 RAG 過程中的技能。強化偏好優化階段則通過根據主 LLM 的反饋調整助手的輸出，確保助手提供的幫助更加貼合主 LLM 的需求。

2.4 AssisTRAG 推理

AssisTRAG 通過三個步驟啟動其推理過程：

1. 信息檢索與整合

在這個初始階段，AssisTRAG 首先激活 Action II 來理解主 LLM 的信息需求。然后，它使用 Tool I 和 Tool II 分別從內部記憶和外部知識庫中檢索相關信息。接著，它調用 Action III 從檢索到的文檔中提取關鍵知識。

2. 決策

在這一階段，AssisTRAG 決定是否將檢索到的記憶和提取的知識提供給主 LLM。它激活 Plan I 和 Plan II 來評估這些檢索到的記憶和知識對當前問題的相關性和有用性。如果助手認為這些信息有幫助，它們將被提供給主 LLM 以輔助回答生成。

3. 回答生成與記憶更新

在最后階段，AssisTRAG 提示主 LLM 根據問題、其內部知識和助手提供的信息生成答案。之后，AssisTRAG 激活 Action I，利用其筆記功能，捕捉交互中的關鍵推理步驟并將其納入其記憶中。這確保了助手的知識庫保持最新。

實驗效果

淺看引入智能信息助理提升大模型處理復雜推理任務的潛力-AssisTRAG-AI.x社區

參考文獻

Boosting the Potential of Large Language Models with an Intelligent Information Assistant，https://arxiv.org/pdf/2411.06805v1

本文轉載自公眾號大模型自然語言處理作者：余俊暉

原文鏈接：??https://mp.weixin.qq.com/s/fLO1i9uW8R4OQbF9nYGP9Q??

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

RAG

已于2024-11-28 18:53:15修改

贊

回復

舉報

回復

相關推薦

三大關鍵技術看RAG如何提升LLM的能力

angel ? 8099瀏覽 ? 0回復
ICLR'24 | 對比學習引入全周期時間序列信息提升長周期時序預測效果

海因斯DK ? 4766瀏覽 ? 0回復
Transformer在復雜推理任務中的新進展：多步邏輯推理中的匹配策略

xuxiangda ? 5615瀏覽 ? 0回復
微軟發布Florence-2：用于處理各種視覺任務的小模型

AIGC最前線 ? 4467瀏覽 ? 0回復
大語言模型在不同自然語言處理任務中的提示工程方法綜述

sbf_2000 ? 3542瀏覽 ? 0回復
用于復雜RAG任務的先進可控Agent

PaperAgent ? 2678瀏覽 ? 0回復
大模型時代信息抽取任務該何去何從？復旦發布InstructUIE提升大模型信息抽取能力

arnoldzhw ? 4817瀏覽 ? 0回復
OpenAI 發布新模型 o1，能夠推理復雜任務，在科學、編程和數學等領域更牛

AI洞察Insight ? 2626瀏覽 ? 0回復
StaR ｜用少量推理數據讓模型學會通用推理能力，顯著提升模型復雜推理

arnoldzhw ? 3364瀏覽 ? 0回復
使用MCTS顯著提升LLM在復雜任務的推理能力

arnoldzhw ? 6692瀏覽 ? 0回復
混合RAG系統，提升復雜推理任務表現

大模型自然語言處理 ? 2498瀏覽 ? 0回復
讓你的RAG應用更加智能！引入自我反思的大模型 RAG 框架(Self-RAG)

AI博物院 ? 3004瀏覽 ? 0回復
淺看大模型用于Text2SQL的綜述

大模型自然語言處理 ? 3508瀏覽 ? 0回復
當大模型也配備“秘書”：AssistRAG 的創新與應用

芝士AI吃魚 ? 2454瀏覽 ? 0回復
多模態大模型Reyes增加batch推理方式，提升推理速度

大模型自然語言處理 ? 2278瀏覽 ? 0回復
LMEDR對話模型：引入自然語言推理數據提升對話模型的連貫性和一致性

arnoldzhw ? 2196瀏覽 ? 0回復
在自然語言處理(NLP)任務中，怎么處理數據——即怎么把文字輸入到模型中進行處理？

AI探索時代 ? 1984瀏覽 ? 0回復
人工智能小白到高手：RAG通過重排（Reranking）提升信息檢索的質量

AI取經路 ? 1919瀏覽 ? 0回復
大模型數據預處理——關于復雜文檔在大模型應用中的解決方案

AI探索時代 ? 1653瀏覽 ? 0回復

大模型自然語言處理

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學堂

淺看引入智能信息助理提升大模型處理復雜推理任務的潛力-AssisTRAG 原創

1. 組件

2. AssisTRAG

2.1 記憶管理

2.2 知識管理

2.3 AssisTRAG 訓練

2.4 AssisTRAG 推理

實驗效果

參考文獻

目錄