向o1看齊，Google開源RAG推理擴展，提升近60%

NLP前沿1

發布于 2024-11-5 14:39

瀏覽

0收藏

論文筆記分享，標題Inference Scaling for Long-Context Retrieval Augmented Generation，來自google deepmind

openai o1通過讓擴展推理，讓模型在推理方面達到非常優異的性能。google這篇內容，核心想驗證2個點

RAG系統的性能，如何從推理計算擴展中受益
通過建立RAG性能和推理參數之間的關系模型來預測給定預算下的最佳測試時計算分配

文中應用了2種擴展方式，DRAG，IterRAG均有效的提高了RAG系統的性能。并且，當最優分配時，增加推理計算幾乎可以線性提升RAG性能，這種關系表示為RAG的推理擴展法則。

向o1看齊，Google開源RAG推理擴展，提升近60%-AI.x社區

在RAG中，與O1不同的是，用有效上下文長度來衡量推理計算。有效上下文長度為在LLM輸出最終答案之前，所有迭代中總的輸入token數量。

對于大多數只調用一次LLM的方法，有效上下文長度相當于prompt中的token數量，并受限于LLM的上下文窗口限制。

這里排除輸出成本和檢索成本，因為LLMs通常在知識密集型任務中通常答案比較短，可能是精確的實體或數字。

2種擴展上下文的方式

向o1看齊，Google開源RAG推理擴展，提升近60%-AI.x社區

DRAG

D是Demo的意思，就是通過提供多個RAG的示例作為few-shot，提高LLMs的上下文能力。
輸入構成有3部分，檢索到的文檔、輸入query以及相應的問題和答案示例。所以可以擴展的有2部分，就是檢索的文檔數量，以及示例的數量。

IterRAG

Iter就是迭代的意思，通過將復雜查詢分解為多個子查詢來解決多跳的問題
在每次迭代中，模型可能會生成一個子查詢、一個中間答案或最終答案。這個過程會重復迭代，直到生成最終答案或達到最大迭代次數。

總體的呈現線性的擴展規律，性能跟上下文長度之間。DRAG受限于1M窗口的限制，IterRAG可以通過迭代在更長上下文的時候表現出良好的擴展。

向o1看齊，Google開源RAG推理擴展，提升近60%-AI.x社區

參數特定的縮放，總體而言，，擴大檢索范圍、增加例子數量、增加生成步驟的數量都會提高性能，但是收益會因有效上下文長度和方法的不同而不同。看下圖斜率，增加文檔數量可以得到更大的提升。并且DRAG和IterRAG的飽和程度不同。

向o1看齊，Google開源RAG推理擴展，提升近60%-AI.x社區

最后給定上下文長度的最大預算，一個公式如下，其中中考慮了文檔數量，示例，迭代次數等參數。但是這些參數跟特定模型相關。需要對進行實驗，然后MSE算出a、b、c的最優值。

向o1看齊，Google開源RAG推理擴展，提升近60%-AI.x社區

本文轉載自 ??NLP前沿??，作者： ??NLP前沿??

標簽

開源

RAG

推理

贊

回復

舉報

回復

相關推薦

剛剛，OpenAI發布史上最強模型-o1，推理能力超人類博士！

Aceryt ? 2747瀏覽 ? 0回復
OpenAI發布突破性AI模型o1系列，推理能力大幅躍升重塑行業格局

芝士AI吃魚 ? 2869瀏覽 ? 0回復
OpenAI o1模型推理能力大幅提升的背后：重復采樣如何提升AI推理能力

Syrupup ? 3878瀏覽 ? 0回復
OpenAI o1推理模型基礎入門

51CTO內容精選 ? 2528瀏覽 ? 0回復
開源社區離Openai o1越來越近~

NLP前沿1 ? 2635瀏覽 ? 0回復
o1推理擴展的風吹到了RAG，性能飆升58.9%！

PaperAgent ? 2763瀏覽 ? 0回復
OpenAI o1：用內部思維鏈進行復雜推理

shizhi02 ? 2672瀏覽 ? 0回復
擊敗GPT-4o、僅次于o1！英偉達重磅開源超強大模型--Nemotron

Aceryt ? 3325瀏覽 ? 0回復
VLM版o1超越一眾開源和閉源模型！LLaVA-o1：多階段自主推理（北大&清華&阿里等）

angel ? 2803瀏覽 ? 0回復
解密o1推理過程！DeepSeek-R1-Lite預覽版上線

kede96 ? 3179瀏覽 ? 0回復
解讀 Marco - o1：邁向開放式推理模型的探索與實踐

AI論文解讀 ? 2873瀏覽 ? 0回復
阿里重磅開源QwQ-32B：自我思考、糾正，數學能力擊敗o1模型

Aceryt ? 7936瀏覽 ? 0回復
阿里發布類o1模型QWQ，可自我反思糾錯，實測數學推理遠超o1、DS-R1，人人免費

51CTO技術棧 ? 3056瀏覽 ? 0回復
大語言模型o1慢思考推理系統的破局之路：模仿、探索與自我提升的深度揭秘！

十一月雨_55 ? 4036瀏覽 ? 0回復
開源版o1！中國大模型讓國外陷入瘋狂，成本猛降90%

Aceryt ? 3261瀏覽 ? 0回復
Kimi深夜炸場：滿血版多模態o1級推理模型！OpenAI外全球首次！Jim Fan：同天兩款國產o1絕對不是巧合！

51CTO技術棧 ? 2318瀏覽 ? 0回復
最簡單的推理擴展方案，效果媲美o1！

NLP前沿1 ? 1813瀏覽 ? 0回復
DeepSeek R1 Vs OpenAI o1！全球頂級推理模型訓練技術對比大解密！

51CTO技術棧 ? 6116瀏覽 ? 0回復
o1模型醫學推理驚人，超過人類醫生

Aceryt ? 2038瀏覽 ? 0回復

NLP前沿1

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學堂

向o1看齊，Google開源RAG推理擴展，提升近60%

目錄