成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

CAG來(lái)了,RAG慌了?

發(fā)布于 2025-1-14 13:14
瀏覽
0收藏

CAG:Cache-Augmented Generation  緩存增強(qiáng)生成。

不要做 RAG 了:當(dāng)緩存增強(qiáng)生成對(duì)于知識(shí)任務(wù)就足夠時(shí)

檢索增強(qiáng)生成(RAG)作為一種通過(guò)整合外部知識(shí)源來(lái)增強(qiáng)語(yǔ)言模型的有效方法,已經(jīng)得到了廣泛應(yīng)用。然而,RAG 引入了檢索延遲、文檔選擇潛在錯(cuò)誤和系統(tǒng)復(fù)雜性增加等挑戰(zhàn)。隨著具有顯著擴(kuò)展上下文窗口的大型語(yǔ)言模型(LLMs)的出現(xiàn),本文提出了一種替代范式,即緩存增強(qiáng)生成(CAG),它繞過(guò)了實(shí)時(shí)檢索。我們的方法涉及預(yù)先加載所有相關(guān)資源,特別是當(dāng)檢索的文檔或知識(shí)有限且可管理時(shí),將其加載到 LLM 的擴(kuò)展上下文中,并緩存其運(yùn)行時(shí)參數(shù)。在推理過(guò)程中,模型利用這些預(yù)先加載的參數(shù)來(lái)回答查詢(xún),而無(wú)需額外的檢索步驟。比較分析表明,CAG 消除了檢索延遲,并最小化了檢索錯(cuò)誤,同時(shí)保持了上下文相關(guān)性。在多個(gè)基準(zhǔn)測(cè)試中的性能評(píng)估突出了長(zhǎng)上下文 LLMs 在哪些場(chǎng)景下優(yōu)于或補(bǔ)充了傳統(tǒng)的 RAG 管道。這些發(fā)現(xiàn)表明,對(duì)于某些應(yīng)用,尤其是那些知識(shí)庫(kù)受限的應(yīng)用,CAG 提供了一種簡(jiǎn)化和高效的替代方案,與 RAG 相比,在降低復(fù)雜性的同時(shí)實(shí)現(xiàn)可比或更優(yōu)的結(jié)果。

感覺(jué)還是longcontext VS RAG,隨便寫(xiě)寫(xiě),好像容易被噴。

套了層緩存的殼。

CAG來(lái)了,RAG慌了?-AI.x社區(qū)

{context} + prompt + query

CAG對(duì){context}部分的KV提前緩存, RAG的{context}部分是動(dòng)態(tài)的。

3個(gè)階段: 緩存 -> 推理 -> cacheReset(就是應(yīng)對(duì)多輪,超長(zhǎng)了,截?cái)嘁幌拢?/p>

CAG來(lái)了,RAG慌了?-AI.x社區(qū)

優(yōu)勢(shì):(引用)

  1. 知識(shí)庫(kù)有限且可控:當(dāng)需要處理的文檔或知識(shí)量不大時(shí),CAG 可以輕松勝任。
  2. 追求極致效率:對(duì)于需要快速響應(yīng)的應(yīng)用,CAG 的優(yōu)勢(shì)更加突出。
  3. 需要一致的上下文理解:CAG 可以讓模型對(duì)所有知識(shí)有更全面的理解,從而生成更準(zhǔn)確、更一致的回答。

CAG來(lái)了,RAG慌了?-AI.x社區(qū)

本文轉(zhuǎn)載自 ??NLP前沿??,作者: ??NLP前沿??

標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 国产成人福利在线观看 | 日韩成人在线观看 | 亚洲一区二区三区久久 | 亚洲伊人a | 国产伦精品一区二区三区照片91 | 亚洲一区二区三区在线观看免费 | 日本超碰在线 | 真人一级毛片 | 国产精品v | 中文字幕精品视频 | 久久99久久 | 成人精品国产 | 成人在线精品视频 | 毛片在线免费 | 亚洲日韩中文字幕一区 | 久草中文在线 | 一区二区三区日 | 涩涩视频在线看 | 大象一区| 国产一区视频在线 | 欧美黄色录像 | 99视频精品 | 国产精品久久久久久福利一牛影视 | 欧美精品一区在线发布 | 精品视频亚洲 | 日屁视频 | 欧美日韩国产在线观看 | 国产精品久久久亚洲 | 久久精品亚洲成在人线av网址 | 中文在线观看视频 | 日韩视频在线一区 | 91在线免费观看网站 | 美日韩免费视频 | 青娱乐自拍 | 日日干夜夜操 | 国产精品毛片一区二区三区 | a在线免费观看 | 日本成人在线网址 | 秋霞在线一区二区 | 一级做a爰片久久毛片免费看 | 午夜精品视频在线观看 |