成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<samp id="symcz"></samp>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

RAG應用要如何吃到大模型長上下文的紅利？-LongRAG

發布于 2025-6-4 06:19

瀏覽

0收藏

去年底的時候，筆者寫過，與其在RAG系統上雕花，可以重新思考一下，自己的業務場景是否非RAG不可嗎？隨著去年大模型的蓬勃發展，長度外推、更長的上下文模型，更厲害的中文底座大模型，都可以讓整個系統的壓力往生成部分上遷移。

后來筆者造了一個詞，文檔片段化。對于常規的pdf問答檔問答，基本上都能使用單一的大模型覆蓋到了。但是對于知識庫，文檔庫的問答，似乎RAG還是必不可少的。但是如果生成模型能力更強了，那與其在思考如何去更好的解析文檔結構，去劃分塊大小，不如放大維度，把更大粒度的文本，如文檔，當作傳統的塊，可以省掉很多細碎的工作。

回歸主題，RAG場景如何吃到大模型長上下文的紅利？本文主要是分享新出的一個研究工作LongRAG，為了解決檢索器和閱讀器之間工作量不平衡的問題，文中提出了一個新的框架，稱為 LongRAG，它包括一個“長檢索器” （long retriever）和一個“長閱讀器”(long reader - llm)。文檔塊變長很顯然，long retriever應該如何設計才能保證召回效果（正確答案的塊相比與短塊包含了更多的噪聲），這個是本文的核心內容。

LongRAG 將整個維基百科處理成4K-token的chunks，這比以前的chunk長度長了30倍。通過增加chunk大小，顯著減少了總chunk數，從22M減少到600K。使用現有的長上下文大型語言模型（LLM）進行答案提取，在NQ數據集上，LongRAG將答案召回率@1從52%提高到71%，在HotpotQA數據集上，將答案召回率@2從47%提高到72%。LongRAG在不需要任何訓練的情況下，取得了與經過微調的RAG模型相當的結果。

文章地址如下：

https://arxiv.org/html/2406.15319v1

框架對比圖如下，相比于vanilla rag的模式（下圖左），longrag采樣更大的塊大小（下圖右），所以理論上上對long retriever上應該需要一些特別的操作。

RAG應用要如何吃到大模型長上下文的紅利？-LongRAG-AI.x社區

long retriever

傳統的 RAG 中，檢索塊 g 通常是從文檔 d 中分離出來的一小段段落，包含數百個標記。在這里，g 可能與整個文檔甚至多個文檔一樣長，所以像傳統那樣算相似度可能就會有比較多的噪聲干擾了。

因此首先能合并在一起的文檔那不能不太相關聯，不然召回之后作為模型的上下文噪聲太大了。所以第一步需要先進行一個文檔分組，這個算法類似于以前的那種流式聚類，還是什么聚類，名詞記不太清了。文檔是否相關使用的文檔的連邊，類似于那種有結構層級的知識庫的大目錄信息。細看就是如下圖，很好理解：

RAG應用要如何吃到大模型長上下文的紅利？-LongRAG-AI.x社區

然后計算相似度，傳統那樣query-passage計算比較有難度，所以使用近似，算query和passage中的小塊的最大相似度，這個小塊的粒度是個實驗維度，可能是段落，也可能是文檔級，也可能是上面的文檔組。

RAG應用要如何吃到大模型長上下文的紅利？-LongRAG-AI.x社區

到這里，核心的算法原理部分基本就結束了，對了，還有一個超參數，對于小的文檔塊召回為了提高召回率，一般用比較大的k。但是這里不行了，論文中設置的k為4到8。

核心的實驗

下圖為，使用段落、文檔、文檔組召回，真實答案的召回率（最右邊一行），召回數量更多，召回率肯定更高，這個沒什么好說的。召回塊越大，需要達到接近的召回率的top k越少。

RAG應用要如何吃到大模型長上下文的紅利？-LongRAG-AI.x社區

最后

整體的結論在前面提過了，很優秀。塊長度變長，信息包含的更多，可能很難用一個向量來表達完整的內容，所以longrag的更多的探索會發生在如何有效且精準的找到包含答案片段的大塊。本文中使用的近似策略以及文檔組的構建都是在這個領域，目前很少見的探索嘗試，并提供了一些實驗論證。

本文轉載自????NLP前沿????，作者：NLP前沿

標簽

贊

收藏

回復

舉報

回復

相關推薦

港中文提出CLongEval中文基準測試集，準確評估大模型長上下文能力

zhangyannni ? 5502瀏覽 ? 0回復
LLM超長上下文查詢-性能評估實戰

ermulong ? 3154瀏覽 ? 0回復
百萬上下文RAG，Agent還能這么玩

ermulong ? 3676瀏覽 ? 0回復
LLM超長上下文查詢-性能評估實戰

ermulong ? 2919瀏覽 ? 0回復
提升5.69倍，高效RAG上下文壓縮方法COCOM

Aceryt ? 2529瀏覽 ? 0回復
長上下文 還是 RAG？ Google:我全都要！

探索AGI ? 2458瀏覽 ? 0回復
在長上下文LLM的時代，RAG是否仍然必要？

sbf_2000 ? 2621瀏覽 ? 0回復
#AIGC創新先鋒者征文大賽# RAG vs 長上下文 LLMs：誰主沉浮？

Baihai_IDP ? 2387瀏覽 ? 0回復
智能決策進化之路：從長上下文LLM到自主RAG系統

Halo咯咯 ? 3592瀏覽 ? 0回復
長上下文語言模型評估體系探析

Baihai_IDP ? 2876瀏覽 ? 0回復
大模型超長窗口上下文與檢索增強生成——RAG

AI探索時代 ? 2767瀏覽 ? 0回復
Claude的MCP（模型上下文協議）簡介

Halo咯咯 ? 5292瀏覽 ? 0回復
RAG系統中的困境：上下文不是想加就能加的

芝士AI吃魚 ? 2346瀏覽 ? 0回復
為什么大語言模型難以處理長上下文？從 Transformer 到 Mamba

Baihai_IDP ? 3180瀏覽 ? 0回復
高效注意力機制與硬件優化：硬件優化的稀疏注意力，長上下文建模

AI研究前瞻 ? 2279瀏覽 ? 0回復
如何使用模型上下文協議構建自定義工具

51CTO內容精選 ? 2648瀏覽 ? 0回復
基于多模態大語言模型的上下文目標檢測

AIRoobt ? 2536瀏覽 ? 0回復
LLM 上下文管理：智能應用的核心競爭力

草臺AI ? 1425瀏覽 ? 0回復
SWAN-GPT：突破長上下文瓶頸的革命性架構設計

頓數AI ? 1356瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

阿里開源VRAG-RL：定義下一代檢索增強生成 2025-06-16 07:56:18發布
高端的推理模型，僅需一個訓練樣本！ 2025-05-21 06:48:13發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇：高端的推理模型，僅需一個訓練樣本！

下一篇：阿里開源VRAG-RL：定義下一代檢索增強生成

社區精華內容

目錄

主站蜘蛛池模板：涩涩99| 九九热免费视频在线观看 | 拍拍无遮挡人做人爱视频免费观看 | 波多野结衣中文视频 | 欧美综合一区二区三区 | 91精品国产91久久久久久 | 国产福利视频 | 久久精品亚洲一区二区三区浴池 | 99re视频| 国产精久久久久久 | 久久国产精品偷 | 中文一区二区视频 | 四虎影视在线 | 成人在线观看免费 | aaaa网站 | 天堂在线一区 | 亚洲一区二区久久 | 国产亚洲网站 | 日韩欧美亚洲 | 久久久久久免费精品一区二区三区 | 日本欧美视频 | 91久操视频 | 国产精品久久久久久婷婷天堂 | 日本精品一区二区在线观看 | 国产成人综合av | 久久亚洲国产精品 | 99免费精品视频 | 精品综合久久 | 精品国产免费人成在线观看 | 久久国产精品一区二区三区 | 一区二区三区国产好 | 精精国产视频 | 性色网站 | 国产美女在线观看 | 综合久久综合久久 | 亚洲区一区二区 | 婷婷激情在线 | 国产精品日日做人人爱 | av黄色在线| 成人影院在线视频 | 91精品国产综合久久久久 |

<sup id="ngrtl"><dd id="ngrtl"></dd></sup>

<samp id="ngrtl"><sub id="ngrtl"></sub></samp>