成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大模型面經(jīng)—RAG工程實(shí)踐經(jīng)驗(yàn)總結(jié) 原創(chuàng)

發(fā)布于 2024-10-24 13:29
瀏覽
0收藏

?RAG工程經(jīng)驗(yàn)面經(jīng)總結(jié)。

雖然RAG工程整體有很多論文、算法和方法論,但在實(shí)際使用過程中,當(dāng)數(shù)據(jù)量大了RAG很容易出現(xiàn)不可控的問題, 本篇就針對實(shí)踐過程中遇到的問題總結(jié)面經(jīng)進(jìn)行分享,看看能不能給大家提供一些幫助。下面是一個(gè)快捷目錄。

一. RAG如何去優(yōu)化索引結(jié)構(gòu)? 

二. 當(dāng)混合檢索以及基于不同大小的chunk去檢索效果都不太好的時(shí)候,如何優(yōu)化?

三. 如何通過rerank去提升RAG效果的,有哪些方案?

下面是答案。

一. RAG如何去優(yōu)化索引結(jié)構(gòu)? 

1. 優(yōu)化被檢索的embedding

1)微調(diào)被檢索的embedding

目的:讓被檢索的內(nèi)容與query之間的相關(guān)性更加緊密

特別是術(shù)語更新較快且比較罕見的領(lǐng)域,可以針對性地進(jìn)行微調(diào)。

2)動態(tài)embedding

目的:基于上下文動態(tài)調(diào)整embedding

當(dāng)然這只是個(gè)發(fā)論文的思路,工程落地的時(shí)候這塊還是有待驗(yàn)證的。

3)檢索后處理流程優(yōu)化

目的:直接把所有檢索結(jié)果給大模型可能會超出上下文窗口限制,內(nèi)容過多噪聲也可能比較多。

優(yōu)化方法:

  •  ReRank
  •  Prompt 壓縮 
  •  RAG 管道優(yōu)化 
  •  混合搜索
  •  遞歸檢索與查詢引擎 
  •  StepBack-prompt 方法 
  •  子查詢 
  •  HyDE 方法

2. 優(yōu)化query的chunk大小

chunk大小非常關(guān)鍵,決定了從向量存儲中檢索的文檔的長度。小塊可能導(dǎo)致文檔缺失一些關(guān)鍵信息,而大塊可能引入無關(guān)的噪音。找到最佳塊大小是要找到正確的平衡。

目前來說一般是按不同塊大小劃分驗(yàn)證集做實(shí)驗(yàn),直接用驗(yàn)證集效果說話。

3. 結(jié)合不同粒度信息進(jìn)行混合檢索

雖然向量搜索有助于檢索與給定查詢相關(guān)的語義相關(guān)塊,但有時(shí)在匹配特定關(guān)鍵詞方面缺乏精度。根據(jù)用例,有時(shí)可能需要精確匹配。

混合檢索就是結(jié)合embedding搜索和關(guān)鍵詞搜索。

二. 當(dāng)混合檢索以及基于不同大小的chunk去檢索效果都不太好的時(shí)候,如何優(yōu)化?

這種情況就要針對具體的case關(guān)注知識庫里是否有答案了。

如果有答案但是沒檢索出來,那么大概率可能答案被錯(cuò)誤分割開了,那么可以結(jié)合一些小模型(BERT等)拿來做上下句預(yù)測;

另外也可以分析 query 和 doc 的特點(diǎn):字相關(guān)還是語義相關(guān),一般建議是先用推薦系統(tǒng)經(jīng)典的ES做召回,然后才用模型做精排

三. 如何通過rerank去提升RAG效果的,有哪些方案?

背景:當(dāng)檢索時(shí),前K個(gè)結(jié)果不一定按最相關(guān)的方式排序。它們都是相關(guān)的, 但在這些相關(guān)內(nèi)容中,最相關(guān)的可能并不是第1或第2個(gè),而是排名靠后的。rerank就是將最相關(guān)的信息重新定位到排名靠后的檢索結(jié)果。

這里推薦一些思路:

Diversity Ranker 根據(jù)文檔的多樣性進(jìn)行重新排序; 

LostInTheMiddleRanker 中提出LLM 會著重把注意力放在文本開頭和結(jié)尾的位置,那就把最需要讓 LLM 關(guān)注的 documents 放在開頭和結(jié)尾的位置。

另外還有一些經(jīng)典的框架LlamaIndex、LangChain 和 HayStack都可以參考和直接用。

其實(shí)主要的思路都大同小異,實(shí)際工作中還是主要會結(jié)合具體的case來優(yōu)化,大家有更多的問題和經(jīng)驗(yàn)也可以一起分享討論。

參考文獻(xiàn)

[1]  Retrieval-Augmented Generation for Large Language Models: A Survey(arxiv.org/pdf/2312.10997)

[2] 論文分享|RAG理論-第一篇-概述 - 知乎(https://zhuanlan.zhihu.com/p/678616587)

[3] 提升RAG性能的關(guān)鍵技術(shù):從數(shù)據(jù)清理到混合檢索的全方位討論 - 知乎(https://zhuanlan.zhihu.com/p/676463769)

?

文轉(zhuǎn)載自公眾號瓦力算法學(xué)研所,作者:喜歡瓦力的卷卷

原文鏈接:??https://mp.weixin.qq.com/s/xcGvL2WhgV2tKT3JdiF6GA???

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 精品国产乱码久久久久久88av | 亚洲国产精品va在线看黑人 | 深夜爽视频| 久久99精品国产 | 午夜久久久久久久久久一区二区 | 亚洲第一区国产精品 | 午夜激情在线视频 | 亚洲精品久久久久中文字幕欢迎你 | 九色视频网站 | 欧美偷偷操| 皇色视频在线 | 欧美日韩综合一区 | 欧美日韩亚洲国产 | 成人夜晚看av | av男人的天堂在线 | 91社区在线观看播放 | 亚洲成av人片在线观看无码 | 免费国产一区二区 | 免费精品| 伦理一区二区 | 欧美日韩亚洲三区 | 免费 视频 1级 | 欧美国产日韩成人 | 日韩欧美电影在线 | 中文字幕在线免费观看 | 欧美日韩免费视频 | 国产午夜久久久 | 精品亚洲一区二区三区 | 欧美一级片久久 | 狠狠综合久久av一区二区小说 | 超黄毛片 | av中文字幕网 | 亚洲精品国产成人 | 精品国产不卡一区二区三区 | 亚洲国产一区在线 | 二区视频| 成人网在线观看 | 久久成人精品视频 | 亚洲国产福利视频 | 中文字幕亚洲一区二区va在线 | 一区二区三区日本 |