成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<input id="ui62k"></input>

<blockquote id="ui62k"><tr id="ui62k"></tr></blockquote>

<samp id="ui62k"><option id="ui62k"></option></samp>

<bdo id="ui62k"><tbody id="ui62k"></tbody></bdo>

<input id="ui62k"></input>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

大模型面經(jīng)—RAG工程實(shí)踐經(jīng)驗(yàn)總結(jié) 原創(chuàng)

發(fā)布于 2024-10-24 13:29

瀏覽

0收藏

?RAG工程經(jīng)驗(yàn)面經(jīng)總結(jié)。

雖然RAG工程整體有很多論文、算法和方法論，但在實(shí)際使用過程中，當(dāng)數(shù)據(jù)量大了RAG很容易出現(xiàn)不可控的問題，本篇就針對實(shí)踐過程中遇到的問題總結(jié)面經(jīng)進(jìn)行分享，看看能不能給大家提供一些幫助。下面是一個(gè)快捷目錄。

一. RAG如何去優(yōu)化索引結(jié)構(gòu)？

二. 當(dāng)混合檢索以及基于不同大小的chunk去檢索效果都不太好的時(shí)候，如何優(yōu)化？

三. 如何通過rerank去提升RAG效果的，有哪些方案？

下面是答案。

一. RAG如何去優(yōu)化索引結(jié)構(gòu)？

1. 優(yōu)化被檢索的embedding

1）微調(diào)被檢索的embedding

目的：讓被檢索的內(nèi)容與query之間的相關(guān)性更加緊密

特別是術(shù)語更新較快且比較罕見的領(lǐng)域，可以針對性地進(jìn)行微調(diào)。

2）動態(tài)embedding

目的：基于上下文動態(tài)調(diào)整embedding

當(dāng)然這只是個(gè)發(fā)論文的思路，工程落地的時(shí)候這塊還是有待驗(yàn)證的。

3）檢索后處理流程優(yōu)化

目的：直接把所有檢索結(jié)果給大模型可能會超出上下文窗口限制，內(nèi)容過多噪聲也可能比較多。

優(yōu)化方法：

ReRank
Prompt 壓縮
RAG 管道優(yōu)化
混合搜索
遞歸檢索與查詢引擎
StepBack-prompt 方法
子查詢
HyDE 方法

2. 優(yōu)化query的chunk大小

chunk大小非常關(guān)鍵，決定了從向量存儲中檢索的文檔的長度。小塊可能導(dǎo)致文檔缺失一些關(guān)鍵信息，而大塊可能引入無關(guān)的噪音。找到最佳塊大小是要找到正確的平衡。

目前來說一般是按不同塊大小劃分驗(yàn)證集做實(shí)驗(yàn)，直接用驗(yàn)證集效果說話。

3. 結(jié)合不同粒度信息進(jìn)行混合檢索

雖然向量搜索有助于檢索與給定查詢相關(guān)的語義相關(guān)塊，但有時(shí)在匹配特定關(guān)鍵詞方面缺乏精度。根據(jù)用例，有時(shí)可能需要精確匹配。

混合檢索就是結(jié)合embedding搜索和關(guān)鍵詞搜索。

二. 當(dāng)混合檢索以及基于不同大小的chunk去檢索效果都不太好的時(shí)候，如何優(yōu)化？

這種情況就要針對具體的case關(guān)注知識庫里是否有答案了。

如果有答案但是沒檢索出來，那么大概率可能答案被錯(cuò)誤分割開了，那么可以結(jié)合一些小模型（BERT等）拿來做上下句預(yù)測；

另外也可以分析 query 和 doc 的特點(diǎn)：字相關(guān)還是語義相關(guān)，一般建議是先用推薦系統(tǒng)經(jīng)典的ES做召回，然后才用模型做精排

三. 如何通過rerank去提升RAG效果的，有哪些方案？

背景：當(dāng)檢索時(shí)，前K個(gè)結(jié)果不一定按最相關(guān)的方式排序。它們都是相關(guān)的，但在這些相關(guān)內(nèi)容中，最相關(guān)的可能并不是第1或第2個(gè)，而是排名靠后的。rerank就是將最相關(guān)的信息重新定位到排名靠后的檢索結(jié)果。

這里推薦一些思路：

Diversity Ranker 根據(jù)文檔的多樣性進(jìn)行重新排序；

LostInTheMiddleRanker 中提出LLM 會著重把注意力放在文本開頭和結(jié)尾的位置，那就把最需要讓 LLM 關(guān)注的 documents 放在開頭和結(jié)尾的位置。

另外還有一些經(jīng)典的框架LlamaIndex、LangChain 和 HayStack都可以參考和直接用。

其實(shí)主要的思路都大同小異，實(shí)際工作中還是主要會結(jié)合具體的case來優(yōu)化，大家有更多的問題和經(jīng)驗(yàn)也可以一起分享討論。

參考文獻(xiàn)

[1] Retrieval-Augmented Generation for Large Language Models: A Survey(arxiv.org/pdf/2312.10997)

[2] 論文分享|RAG理論-第一篇-概述 - 知乎(https://zhuanlan.zhihu.com/p/678616587)

[3] 提升RAG性能的關(guān)鍵技術(shù)：從數(shù)據(jù)清理到混合檢索的全方位討論 - 知乎(https://zhuanlan.zhihu.com/p/676463769)

?

文轉(zhuǎn)載自公眾號瓦力算法學(xué)研所，作者：喜歡瓦力的卷卷

原文鏈接：??https://mp.weixin.qq.com/s/xcGvL2WhgV2tKT3JdiF6GA???

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

生成式AI大模型之提示詞工程實(shí)踐

數(shù)字化助推器 ? 3541瀏覽 ? 0回復(fù)
AIGC 和低代碼結(jié)合應(yīng)用全棧研發(fā)實(shí)踐總結(jié)

卓勝微wjp ? 4341瀏覽 ? 0回復(fù)
解構(gòu)復(fù)合人工智能系統(tǒng)（Compound AI Systems）：關(guān)鍵術(shù)語、理論、思路、實(shí)踐經(jīng)驗(yàn)

Baihai_IDP ? 4358瀏覽 ? 0回復(fù)
實(shí)踐出真知：Agents 領(lǐng)域“一年打怪升級”的經(jīng)驗(yàn)分享

Baihai_IDP ? 3804瀏覽 ? 0回復(fù)
RAG工程如何評測？

shizhi02 ? 3135瀏覽 ? 0回復(fù)
大模型面經(jīng)——以醫(yī)療領(lǐng)域?yàn)槔?em>RAG基礎(chǔ)與實(shí)際應(yīng)用中的痛點(diǎn)

shizhi02 ? 3116瀏覽 ? 0回復(fù)
大模型面經(jīng)——LoRA最全總結(jié)

shizhi02 ? 2944瀏覽 ? 0回復(fù)
大模型面經(jīng)——Langchain總結(jié)

shizhi02 ? 2651瀏覽 ? 0回復(fù)
大模型面經(jīng)——MoE混合專家模型總結(jié)

shizhi02 ? 3026瀏覽 ? 0回復(fù)
有了大模型的應(yīng)用經(jīng)驗(yàn)之后，再談對大模型的理解

AI探索時(shí)代 ? 1756瀏覽 ? 0回復(fù)
大模型面經(jīng)—分布式訓(xùn)練指南

shizhi02 ? 2545瀏覽 ? 0回復(fù)
大模型面經(jīng)—如何評估顯卡利用率及顯卡運(yùn)用優(yōu)化方法

shizhi02 ? 3031瀏覽 ? 0回復(fù)
長文 | 大模型Post-Training總結(jié)

NLP工作站 ? 2930瀏覽 ? 0回復(fù)
RAG范式演進(jìn)及Agentic-RAG總結(jié)綜述

大模型自然語言處理 ? 3555瀏覽 ? 0回復(fù)
大模型面經(jīng)：SFT和RL如何影響模型的泛化或記憶能力？

shizhi02 ? 2591瀏覽 ? 0回復(fù)
大模型面經(jīng)：目前不同階段的scaling law之間的區(qū)別和聯(lián)系是什么？

shizhi02 ? 2896瀏覽 ? 0回復(fù)
大模型面經(jīng)：RAG與Long context“相愛相殺”背景下，如何設(shè)計(jì)最優(yōu)解決方案？

shizhi02 ? 1610瀏覽 ? 0回復(fù)
大模型面經(jīng)——MLLM中模態(tài)對齊有哪些難點(diǎn)？有什么解決方法？

shizhi02 ? 754瀏覽 ? 0回復(fù)
LLM面經(jīng)——多模態(tài)大模型訓(xùn)練中”模態(tài)懶惰“問題如何解決？

shizhi02 ? 519瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

LLM面經(jīng)——多模態(tài)大模型訓(xùn)練中”模態(tài)懶惰“問題如何解決？ 4天前發(fā)布
大模型面經(jīng)——MLLM中模態(tài)對齊有哪些難點(diǎn)？有什么解決方法？ 2025-06-10 10:42:03發(fā)布

熱門推薦

AI Agents開源工具棧全解析~ 1回復(fù)

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復(fù)

Deepseek R1 0528實(shí)測：性能直逼頂尖，普通電腦本地運(yùn)行全攻略 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實(shí)測：真·超DS！ 1回復(fù)

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當(dāng)，實(shí)測來了 0回復(fù)

上一篇： Ultralytics新作-YOLOv11

下一篇：大模型思維鏈升級之DoT框架

社區(qū)精華內(nèi)容

目錄

主站蜘蛛池模板：精品国产乱码久久久久久88av | 亚洲国产精品va在线看黑人 | 深夜爽视频| 久久99精品国产 | 午夜久久久久久久久久一区二区 | 亚洲第一区国产精品 | 午夜激情在线视频 | 亚洲精品久久久久中文字幕欢迎你 | 九色视频网站 | 欧美偷偷操| 皇色视频在线 | 欧美日韩综合一区 | 欧美日韩亚洲国产 | 成人夜晚看av | av男人的天堂在线 | 91社区在线观看播放 | 亚洲成av人片在线观看无码 | 免费国产一区二区 | 免费精品| 伦理一区二区 | 欧美日韩亚洲三区 | 免费视频 1级 | 欧美国产日韩成人 | 日韩欧美电影在线 | 中文字幕在线免费观看 | 欧美日韩免费视频 | 国产午夜久久久 | 精品亚洲一区二区三区 | 欧美一级片久久 | 狠狠综合久久av一区二区小说 | 超黄毛片 | av中文字幕网 | 亚洲精品国产成人 | 精品国产不卡一区二区三区 | 亚洲国产一区在线 | 二区视频| 成人网在线观看 | 久久成人精品视频 | 亚洲国产福利视频 | 中文字幕亚洲一区二区va在线 | 一区二区三区日本 |

<button id="8iceu"><abbr id="8iceu"></abbr></button>

<s id="8iceu"><dd id="8iceu"></dd></s>

<abbr id="8iceu"><menu id="8iceu"></menu></abbr>

<s id="8iceu"><dd id="8iceu"></dd></s>

<center id="8iceu"><code id="8iceu"></code></center>