大模型超長窗口上下文與檢索增強生成——RAG 原創

AI探索時代

發布于 2024-12-4 13:36

瀏覽

0收藏

“ 怎么解決大模型的記憶問題，以及保證結果的準確性，目前還是大模型應用中一個亟待解決的問題 ”

看過作者文章的人對RAG技術應該有了初步的了解，但不知道是否了解大模型的窗口大小；即使沒有研究過大模型的窗口，但也應該聽過每次大模型輸入的內容是有限的；而這個有限就是因為大模型窗口的限制。

那么，大模型窗口與檢索增強的關系是什么樣的？怎么解決長對話問題，隨著大模型窗口的增加，RAG會死嗎？

大模型窗口與RAG

RAG——檢索增強這個技術就不在過多介紹了，如果對此不了解的可以看一下作者之前的文章，比如前幾天的??RAG與本地知識庫，向量數據庫，以及知識圖譜的聯系與區別??。

那么今天主要來介紹一下大模型窗口，以及其與RAG技術的區別。

什么是大模型的窗口？

對技術有了解的人應該都知道，大模型是根據Token進行計費的，所謂的Token就是不同模態的數據，轉化為向量之后的一種計算方式；而大模型的窗口全稱是大模型上下文窗口，簡單來說就是大模型一次能夠接受的Token的大小。

大模型超長窗口上下文與檢索增強生成——RAG-AI.x社區

大模型的窗口為什么如此重要？

原因就在于，大模型的窗口代表著大模型能夠處理數據的大小，窗口越大代表著能夠輸入到大模型的內容越多，大模型能夠捕捉的上下文就越多，內容就越全面，當然效果相對就越好。

舉個栗子來說，假如你想讓大模型回答一些關于四大名著的問題，那么你直接把四大名著直接都輸入到大模型，這樣肯定就能得到更準確，更好的回答；而如果你只是告訴大模型孫悟空三打白骨精的那一段，那么其它的問題大模型就無法回答了。

這就是大模型上下文窗口的作用，能夠增加大模型上下文理解的能力，原因就在于大模型沒有記憶能力。

但大模型的窗口真的是越大越好嗎？大模型的窗口是否能無限大？

大模型的窗口并不是越大越好，當然更不可能無限大；原因在于，上下文窗口越長，對大模型理解能力要求越高；就類似于，讓一個小學生去看上下五千年，雖然小學生可能真的能看懂，但他對很多東西都理解得不深刻。

這樣就會導致一個問題，那就是大模型對長文本理解的不準確，因此控制窗口大小，讓大模型找到自己理解的極限才是最好的。

因此，這也是為什么今年以來大模型的窗口一直在不斷的增長，因為越長的文本處理能力，代表著模型能力越強；但從目前來看，長上下文窗口依然存在很多問題，比如理解不全面，對算力消耗更高，響應時間過長等等。

大模型超長窗口上下文與檢索增強生成——RAG-AI.x社區

為什么說大模型上下文窗口可能會直接導致RAG的死亡？

原因就在于，如果大模型的窗口真的可以無限大，而且大模型又能夠真正理解全部上下文，那么RAG就沒有了存在的意義；因為，直接把全世界所有的數據和資料全部塞進大模型里，這樣大模型就真的無所不知了。

但既然大模型無法做到這一步，因此RAG就肯定有其存在的空間。

其實，歸根結底不論是上下午窗口，還是RAG，亦或者是長對話等等；所有的一切都是因為大模型不具備記憶能力，而想出的補償方法。所以，不論是上下文還是RAG，本身都是為了解決大模型的記憶問題，包括長期記憶和短期記憶。

那么，思考一個問題，長對話問題怎么解決？

其實長對話問題一般有兩個解決方案，就是上面的兩個上下文窗口和RAG；區別就是，上下文窗口是直接把所有歷史對話全部帶入到上下文中，讓大模型自己去理解。而RAG是把對話信息保存到外部數據庫中，然后每次對話都先檢索到與對話最相關的內容，然后拼接到大模型的提示詞中。

當然，還有其它的方案，但暫不在此次討論的范圍之中。

大模型超長窗口上下文與檢索增強生成——RAG-AI.x社區

當然，長對話并不只是簡單的解決記憶問題，還一個重要因素就是準確性；在一些特殊的業務場景下，比如醫療，任何輕微的差別都可能導致致命的錯誤；因此，大模型在醫療領域的應用，怎么才能保證百分之百的準確性，這是一個值得思考的問題。

現在大家對長文本和RAG都有了一定的了解，那么你認為上下文和RAG，哪個才是大模型的最終選擇？

本文轉載自公眾號AI探索時代作者：DFires

原文鏈接：??https://mp.weixin.qq.com/s/ASTnRDYcTDxzNQzrlo96yQ??

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

RAG

大模型

已于2024-12-5 14:58:05修改

贊

回復

舉報

回復

相關推薦

LLM超長上下文查詢-性能評估實戰

ermulong ? 3142瀏覽 ? 0回復
通過檢索增強生成(RAG) 增強LLM的實戰演練

51CTO內容精選 ? 3675瀏覽 ? 0回復
百萬上下文RAG，Agent還能這么玩

ermulong ? 3664瀏覽 ? 0回復
LLM超長上下文查詢-性能評估實戰

ermulong ? 2912瀏覽 ? 0回復
面向大語言模型的檢索增強生成(RAG)技術：綜述

angel ? 5407瀏覽 ? 0回復
長上下文 還是 RAG？ Google:我全都要！

探索AGI ? 2450瀏覽 ? 0回復
15種先進的檢索增強生成（RAG）技術

玄姐聊AGI ? 2791瀏覽 ? 0回復
15種先進的檢索增強生成（RAG）技術

Halo咯咯 ? 2250瀏覽 ? 0回復
引入上下文檢索(Contextual Retrieval)：提升AI模型的精準度與效率

Halo咯咯 ? 2621瀏覽 ? 0回復
再談大模型檢索增強生成——RAG

AI探索時代 ? 2268瀏覽 ? 0回復
基于Agent的金融問答系統：RAG的檢索增強之上下文重排和壓縮

一起AI技術 ? 2359瀏覽 ? 0回復
HiQA：一種用于多文檔問答的層次化上下文增強RAG

大模型自然語言處理 ? 2383瀏覽 ? 0回復
LightRAG：提升檢索增強生成的效率與準確性

Halo咯咯 ? 4542瀏覽 ? 0回復
RAG檢索增強生成和大模型微調的抉擇

AI探索時代 ? 2542瀏覽 ? 0回復
大模型檢索增強生成之向量數據庫的問題

AI探索時代 ? 2541瀏覽 ? 0回復
九種不同類型的檢索增強生成 (RAG)

Halo咯咯 ? 2981瀏覽 ? 0回復
繞過 RAG 實時檢索瓶頸，緩存增強生成（CAG）如何助力性能突破？

Baihai_IDP ? 2278瀏覽 ? 0回復
什么是檢索增強生成 (RAG)？

Halo咯咯 ? 2095瀏覽 ? 0回復
駁“RAG 已死”論：上下文窗口擴展≠RAG 終結

Baihai_IDP ? 776瀏覽 ? 0回復

AI探索時代

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學堂

大模型超長窗口上下文與檢索增強生成——RAG 原創

大模型窗口與RAG

什么是大模型的窗口？

大模型的窗口為什么如此重要？

目錄