成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

當大模型也配備“秘書”：AssistRAG 的創新與應用

發布于 2024-12-13 14:08

瀏覽

0收藏

你是否經歷過這樣的場景：向 ChatGPT 詢問一道復雜的數學題，它給出了一個看似合理但完全錯誤的答案；或者明明上下文里有現成的答案，它卻繞了一大圈給出了不著邊際的回復。這就是大語言模型著名的"幻覺"問題，就像一個博學但不夠嚴謹的學者，時常會腦補一些并不存在的信息?！?/p>

為了解決這個問題，研究人員提出了檢索增強生成(RAG)技術。簡單來說，就是在模型回答問題之前，先讓它查閱相關的資料。這就像是給學者配備了一個圖書館，需要答案時可以先查證一下。但傳統的 RAG 技術還是不夠聰明，就像是一個只會按圖索骵的圖書管理員，找到的資料可能并不是最相關的。　

最近，來自清華大學、香港理工大學和中國人民大學的研究團隊在 NeurIPS 2024 發表了一篇創新性論文，提出了 AssistRAG 框架。這個方案特別有意思，它不是直接改進主模型，而是給模型配備了一個智能助手。這就像是給學者配了一個博學多才的研究助理，不僅會找資料，還能幫忙整理筆記、分析問題。　

為什么傳統 RAG 技術不夠用？

當大模型也配備“秘書”：AssistRAG 的創新與應用-AI.x社區

讓我們通過一個具體的例子來理解傳統 RAG 的局限性。假設用戶問："誰更年長，NBA 球員丹尼·格林還是詹姆斯·沃西？"看似簡單的問題，實際上需要多個步驟：　

首先需要找到丹尼·格林的出生日期，但檢索時發現有多個"丹尼·格林"，有的是拳擊手，有的是音樂家。傳統 RAG 可能會被這些無關信息干擾。
然后是詹姆斯·沃西的信息，同樣需要在眾多文檔中準確定位。
最后還要把兩個日期進行比較，得出結論。

傳統的"檢索-閱讀"模式在每一步都可能出錯：檢索時可能找不到準確信息，閱讀時可能理解錯誤，推理時可能邏輯混亂。就像一個經驗不足的助手，雖然有資料在手，但不知道如何高效地利用?！?/p>

AssistRAG：打造超級智能助手

當大模型也配備“秘書”：AssistRAG 的創新與應用-AI.x社區

那么，如何打造一個稱職的助手呢？AssistRAG 的設計非常巧妙，它讓助手具備了四種關鍵能力：　

第一是高效的信息檢索能力。助手會先分析問題的核心，比如在上面的例子中，它會先確定是在找 NBA 球員丹尼·格林，而不是同名的拳擊手。這就避免了被無關信息干擾。
第二是信息提取和分析能力。找到相關文檔后，助手會提取關鍵信息。比如不會把球員的整個職業生涯都列出來，而是只關注出生日期這個關鍵信息。
第三是記憶管理能力。如果之前已經回答過類似的問題，助手會把這些經驗記錄下來。比如之前可能已經查過詹姆斯·沃西的資料，就不需要重新檢索了。
第四是決策判斷能力。助手會判斷當前的信息是否足夠回答問題。如果信息不充分或有歧義，它會主動進行補充檢索。

研究團隊還設計了一個巧妙的訓練方法。就像培養一個優秀的助理一樣，訓練分為兩個階段：　

當大模型也配備“秘書”：AssistRAG 的創新與應用-AI.x社區

第一階段是基礎技能訓練。通過"課程學習"的方式，先讓助手掌握基本功能。比如先學會做筆記，然后學會分解問題，最后學會提取知識。這就像是先讓助理學會基本的辦公技能，再逐步承擔更復雜的工作。
第二階段是適應性訓練。助手需要學會配合不同主模型的特點。因為每個主模型就像是性格不同的老板，有的喜歡詳細的信息，有的更喜歡簡明扼要的總結。助手通過觀察主模型的反饋，逐漸調整自己的工作方式。

實驗效果令人震驚

AssistRAG 的效果究竟有多好？研究團隊在三個復雜問答數據集上進行了全面測試。結果顯示，它不僅整體表現優秀，在幫助較弱的模型時效果更是驚人。　

最讓人驚喜的是它對弱模型的提升效果。以 LLaMA2-chat-7B 為例，在 HotpotQA 數據集上，傳統 RAG 方法只能達到 23.0% 的 F1 分數，而 AssistRAG 直接提升到了 41.5%，提升幅度達到驚人的 78%！這就像是給一個普通學生配備了一個優秀的助教，成績突飛猛進。　

不僅如此，即便是對于強大的 ChatGPT3.5，AssistRAG 也帶來了顯著提升。在同樣的數據集上，F1 分數從 33.0% 提升到了 44.8%。這說明就算是最頂尖的模型，也能從智能助手那里獲得幫助?！?/p>

實際應用中的精彩案例

讓我們通過一個具體的案例來看看 AssistRAG 是如何工作的。假設用戶問："在維多利亞時代的英國文學作品中，狄更斯和哈代誰出生更早？"　

傳統的 RAG 可能會直接檢索包含這兩個作家名字的文檔，但很可能會被大量的作品介紹、文學評論等無關信息干擾。而 AssistRAG 的處理方式就高明多了：　

首先，助手會將問題分解為兩個子問題：　

查找查爾斯·狄更斯的出生日期
查找托馬斯·哈代的出生日期

然后，助手會有針對性地檢索每個作家的傳記信息，快速定位到關鍵信息：狄更斯出生于 1812 年，哈代出生于 1840 年?！?/p>

更巧妙的是，助手還會把這個信息存入記憶庫。如果以后有人問類似的問題，比如"狄更斯比哈代年長多少歲？"，就能直接使用已有的信息，而不需要重新檢索?！?/p>

總結

AssistRAG 的成功給 AI 領域帶來了很多啟發。首先，它證明了"分工協作"的重要性。就像一個成功的組織需要不同角色的員工相互配合，AI 系統也可以通過不同模塊的協作來實現更好的效果。　

這種框架展現出了極強的擴展潛力。比如在客服系統中，助手可以幫助管理用戶的歷史問題和解決方案；在教育領域，助手可以記錄學生的學習進度和難點，提供更有針對性的輔導?！?/p>

不過，AssistRAG 還有一些值得改進的地方。比如在處理特別長的文本時，檢索效率還有提升空間；在個性化服務方面，如何讓助手更好地理解不同用戶的特點，也是一個值得研究的方向?！?/p>

最讓人期待的是，這種"主模型+智能助手"的架構可能會成為未來 AI 系統的標準配置。就像現在的智能手機都配備了各種智能助手一樣，未來的 AI 系統也可能都會有自己的專屬助手，幫助它們更好地服務用戶?！?/p>

本文轉載自 ??芝士AI吃魚??，作者：芝士AI吃魚

標簽

贊

收藏

回復

舉報

回復

相關推薦

大模型微調新范式：當LoRA遇見MoE

zhangyannni ? 3876瀏覽 ? 0回復
大模型應用與LUI（自然語言交互）落地的關鍵模塊——語義路由實現總結

Syrupup ? 5952瀏覽 ? 0回復
超越DPO，創新大模型優化算法SimPO

Aceryt ? 3812瀏覽 ? 0回復
編碼大模型系列：Meta創新的“代碼編譯優化”的LLM

魯班模錘1 ? 4114瀏覽 ? 0回復
【創新一夏學習季】熱浪升溫，創新一夏，釋放開發潛能

AI.x社區官方賬號 ? 52.9w瀏覽 ? 39回復
一文看懂RAG的各種套路 | 綜述：當RAG遇到大語言模型

大語言模型論文跟蹤 ? 4815瀏覽 ? 0回復
加速AI應用落地，大模型與智能體何以成為“雙驕”

51CTO技術棧 ? 3333瀏覽 ? 0回復
大模型在機器人領域的應用：機遇、挑戰與前景

AIRoobt ? 4720瀏覽 ? 0回復
不要沉迷大模型的技術與理論，學習大模型的方法——從做一個小應用開始

AI探索時代 ? 2845瀏覽 ? 0回復
#AIGC創新先鋒者征文大賽#加速AI應用落地，大模型與智能體何以成為“雙驕”

58AILab ? 2552瀏覽 ? 0回復
#AIGC創新先鋒者征文大賽# 我與AIGC的緣分

萬里悲秋長做客 ? 2264瀏覽 ? 0回復
#AIGC創新先鋒者征文大賽#人工智能在醫療領域的全面應用與未來展望

mb671227aaa63a2 ? 2800瀏覽 ? 0回復
淺看引入智能信息助理提升大模型處理復雜推理任務的潛力-AssisTRAG

大模型自然語言處理 ? 2304瀏覽 ? 0回復
從經典到創新，揭秘擴散模型的6大王牌與5大創新思路

智駐未來 ? 4301瀏覽 ? 0回復
大模型在零樣本面部情緒標注中的突破與應用

xuxiangda ? 2792瀏覽 ? 0回復
當Qwen2.5-Omni遇見老師：教育創新的N種可能

風云2002_1 ? 1324瀏覽 ? 0回復
大模型的能力和大模型應用

AI探索時代 ? 1452瀏覽 ? 0回復
6行代碼讓你的應用也能調用Mcp工具！

Syrupup ? 2211瀏覽 ? 0回復
從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題

AI博物院 ? 4818瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

AI Agent vs Agentic AI：你真的分得清這兩個概念嗎？ 1天前發布
要不要搞多智能體？看看硅谷頂級 AI 公司的經驗 1天前發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇：大語言模型評測中的評價指標：方法、基準和最佳實踐

下一篇： RAG系統中的困境：上下文不是想加就能加的

社區精華內容

目錄

主站蜘蛛池模板：精品欧美一区二区三区精品久久 | 精品国产一区一区二区三亚瑟 | 欧美一级免费 | 精品国产1区2区3区在线国产视频 | 欧美一区中文字幕 | 欧美日韩a | 国产精品福利一区二区三区 | 日本免费视频在线观看 | 又爽又黄axxx片免费观看 | 国产成人在线免费 | 人人射人人插 | 久久久蜜臀国产一区二区 | 91成人小视频 | 人成久久| 99热精品在线观看 | 亚洲精品久久久久久久久久久 | 国产欧美一区二区三区在线看蜜臀 | 国产精品欧美一区二区三区 | 蜜臀网 | 亚洲综合在线视频 | 日韩精品一区二区三区在线播放 | 日韩在线免费视频 | 精品国产欧美在线 | 欧美高清性xxxxhd | 亚洲一区综合 | 亚洲免费一区 | 久久久久亚洲 | 精品福利在线 | 男女在线网站 | 精品欧美激情精品一区 | 国产精品成人一区二区三区夜夜夜 | 美女视频一区 | 亚洲精品女人久久久 | 亚洲欧美日韩精品久久亚洲区 | 国产乱码精品一区二区三区忘忧草 | 麻豆久久久久久久久久 | 欧美一区二区三区视频 | 国产精品久久久久一区二区三区 | 久久这里只有精品首页 | 特一级毛片 | 在线观看中文字幕一区二区 |