RAG圈的DeepSeek，中科院DeepRAG讓大模型帶著“思考”檢索，性能提升21.99%

PaperAgent

發布于 2025-2-5 18:09

瀏覽

0收藏

將推理與RAG相結合仍面臨挑戰，例如復雜查詢需要多步分解，且LLMs難以生成精確的子查詢，導致檢索效率低下。

人類思維過程與 DeepRAG 的對應關系。具體來說，檢索敘事確保了結構化和自適應的檢索流程，根據之前檢索到的信息生成子查詢，并且原子決策動態地決定是否檢索外部知識，或者僅依賴于每個子查詢的參數知識。

中科院&中科大&騰訊微信AI部聯合推出最新（2025.02）DeepRAG，讓大型語言模型逐步推理檢索：

RAG圈的DeepSeek，中科院DeepRAG讓大模型帶著“思考”檢索，性能提升21.99%-AI.x社區

DeepRAG框架將檢索增強推理建模為馬爾可夫決策過程（MDP），通過迭代分解查詢，動態決定是否檢索外部知識或依賴參數推理。

DeepRAG 框架的概述，包括三個步驟：（1）二叉樹搜索，（2）模仿學習，以及（3）校準鏈。給定一個數據集，首先使用二叉樹搜索來合成模仿學習的數據，使模型能夠學習檢索模式。隨后，利用二叉樹搜索構建偏好數據，以進一步校準 LLM 對其知識邊界的認知。

RAG圈的DeepSeek，中科院DeepRAG讓大模型帶著“思考”檢索，性能提升21.99%-AI.x社區

框架包含三個關鍵步驟：

二叉樹搜索（Binary Tree Search）：為每個子查詢構建二叉樹，探索基于參數知識或外部知識庫的不同回答策略。通過這種方式，模型不僅分解問題，還徹底檢查檢索選擇對最終答案的影響。
模仿學習（Imitation Learning）：使用優先隊列高效探索潛在推理軌跡，優先考慮檢索成本較低的路徑。通過二叉樹搜索合成數據，讓模型學習有效的檢索模式，并通過模仿學習提取到達正確最終答案的推理過程。
校準鏈（Chain of Calibration）：通過合成偏好數據確定何時需要檢索，并使用這些數據微調LLMs，增強其基于內部知識邊界的原子決策能力。

MDP建模

狀態（States）：表示對原始問題的部分解決方案。
動作（Actions）：包括終止決策（是否繼續生成子查詢）和原子決策（是否檢索外部知識）。
轉移（Transitions）：根據動作更新狀態。
獎勵（Rewards）：基于答案正確性和檢索成本評估狀態。

數據集：使用五個開放域問答數據集，包括HotpotQA、2WikiMultihopQA、CAG、PopQA和WebQuestions。

基線：與多種現有方法進行比較，包括CoT、CoT-Retrieve、IterDRAG、UAR、FLARE、DRAGIN、TAARE和AutoRAG。

DeepRAG在所有數據集上均優于現有方法，平均答案準確率提高了21.99%，同時提高了檢索效率。

RAG圈的DeepSeek，中科院DeepRAG讓大模型帶著“思考”檢索，性能提升21.99%-AI.x社區

案例研究：Auto-RAG 與 DeepRAG 的對比。DeepRAG 通過原子級查詢分解、可靠的中間答案以及自適應地使用內部知識實現了成功。

RAG圈的DeepSeek，中科院DeepRAG讓大模型帶著“思考”檢索，性能提升21.99%-AI.x社區

https://arxiv.org/abs/2502.01142
DeepRAG: Thinking to Retrieval Step by Step for Large Language Models

本文轉載自??PaperAgent??

標簽

RAG

DeepRAG

大模型

贊

回復

舉報

回復

相關推薦

中科院等：8項測試第一，遠超知乎豆瓣小紅書

Crystalcxt ? 4140瀏覽 ? 0回復
極佳、中科院等9機構聯合首發 | 3萬字長文全面解析世界模型(內容生成/自動駕駛等)

angel ? 6152瀏覽 ? 0回復
全模態預訓練范式MiCo：理解任何模態并學習通用表示｜港中文&中科院

Crystalcxt ? 2916瀏覽 ? 0回復
考考大模型視頻理解能力，中科院人大百川提出新基準合成框架

Crystalcxt ? 2695瀏覽 ? 0回復
再次提升RAG性能：兩種高效的Rerank模型實踐指南

AIGC觀察者 ? 2.2w瀏覽 ? 0回復
RAPTOR 檢索樹再次進一步提升RAG性能的設計思路

AIGC觀察者 ? 4202瀏覽 ? 0回復
文檔概要索引，簡單提升檢索性能的新選擇

恰似驚鴻 ? 2497瀏覽 ? 0回復
優化文本嵌入，大幅提升RAG檢索速度

小虎哦哦 ? 4259瀏覽 ? 0回復
Adaptive-RAG：性能提升50%以上的高效RAG策略

大語言模型論文跟蹤 ? 2784瀏覽 ? 0回復
提升RAG性能的全攻略：優化檢索增強生成系統的策略大揭秘

Halo咯咯 ? 6219瀏覽 ? 0回復
再談大模型向量，由向量檢索引起的思考

AI探索時代 ? 2198瀏覽 ? 0回復
DeepSeek AI發布DeepSeek-V2.5-1210：DeepSeek-V2.5的更新版本，模型性能顯著提升

Halo咯咯 ? 1.5w瀏覽 ? 0回復
中科大揭秘微調大模型的秘訣：如何精準選擇數據提升AI性能

AI論文解讀 ? 3140瀏覽 ? 0回復
中科院、百度提出新架構：突破參數限制，實現高效推理

Aceryt ? 1825瀏覽 ? 0回復
LLM-Reasoner：讓任何大模型都能像DeepSeek R1一樣深入思考

PyTorch研習社 ? 2042瀏覽 ? 0回復
ViDoRAG：提升視覺RAG性能10%

大語言模型論文跟蹤 ? 2278瀏覽 ? 0回復
別讓大模型想太多了，過度思考會影響性能

Aceryt ? 1514瀏覽 ? 0回復
RAG只能應用于文本檢索嗎？關于大模型應用之RAG——檢索增強的思考

AI探索時代 ? 1445瀏覽 ? 0回復
Agentic RAG-R1：讓大模型從「檢索助手」躍升為「思考+搜索王者」！

PaperAgent ? 1362瀏覽 ? 0回復

PaperAgent

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學堂

RAG圈的DeepSeek，中科院DeepRAG讓大模型帶著“思考”檢索，性能提升21.99%

MDP建模

目錄