成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

通用RAG:通過路由模塊對多源異構知識庫檢索生成問答思路 原創

發布于 2025-5-14 07:12
瀏覽
0收藏

如何在多個語料庫(多源異構知識庫,如:文本、圖片、視頻)中檢索和整合來自不同模態和粒度的知識?UniversalRAG:一個多模態RAG框架,用于從多個模態和粒度的語料庫中檢索和整合知識。下面來看看思路,供參考。

方法

通用RAG:通過路由模塊對多源異構知識庫檢索生成問答思路-AI.x社區

(A) 單一模態的 RAG 僅檢索一種模態的數據。(B) 單一語料庫的 RAG 專注于檢索數據模態,而忽略語義。(C) UniversalRAG使用路由器和多個語料庫有效地支持多樣化的查詢,涵蓋不同的模態和粒度。

從上圖可以看到,UniversalRAG的核心思想是通過動態識別和路由查詢到最合適的模態和粒度知識源來進行檢索

  1. 模態感知檢索(Modality-Aware Retrieval):
  • 多模態語料庫:UniversalRAG維護三個獨立的嵌入空間,分別對應文本、圖像和視頻模態。每個模態的語料庫被組織成不同的子語料庫,如:文本語料庫分為段落級和文檔級,視頻語料庫分為完整視頻和視頻片段。
  • 路由模塊(Router):引入一個路由模塊,Router,動態選擇每個查詢的最合適模態。給定一個查詢q,Router預測查詢相關的模態r,并從相應的模態特定語料庫中選擇相關項c。
  1. 粒度感知檢索(Granularity-Aware Retrieval):
  • 多粒度支持:為了靈活適應不同查詢的信息需求,UniversalRAG在每個模態內進一步劃分為多個粒度級別。例如,文本語料庫分為段落級和文檔級,視頻語料庫分為視頻片段和完整視頻。

路由決策:路由決策r分為六類:無檢索(None)、段落(Paragraph)、文檔(Document)、圖像(Image)、片段(Clip)、視頻(Video)。檢索過程根據路由決策r進行,具體公式如下:

通用RAG:通過路由模塊對多源異構知識庫檢索生成問答思路-AI.x社區


路由模塊設計:

一、無訓練的路由

無訓練的路由利用預訓練的LLM的內在知識和推理能力來分類查詢。步驟如下:

  1. 提示設計:給定一個查詢q,LLM會被提供一個詳細的指令描述路由任務,并附帶幾個上下文示例。
  2. 預測路由類型:LLM根據提示和示例預測查詢最合適的檢索類型,從六個預定義的選項中選擇。

小結:這種方法的優勢在于不需要額外的訓練數據,利用了LLM的強大泛化能力。然而,其性能可能受限于LLM的預訓練知識和推理能力。

二、訓練路由

為了提高路由的準確性,UniversalRAG還探索了訓練路由模塊的方法。訓練路由模塊面臨的主要挑戰是缺乏查詢標簽對(ground-truth query-label pairs)來進行最優語料庫選擇的監督。為此,文章采用了一種間接的方法來構建訓練數據集:

  1. 利用基準測試的歸納偏差:假設每個基準測試主要與特定的模態和檢索粒度相關聯。例如,文本問答基準測試中的查詢可能主要需要段落級別的信息,而多跳問答基準測試可能需要文檔級別的信息。
  2. 標簽分配:
  • 對于文本問答基準測試,查詢被標記為'None'(如果查詢可以僅通過模型的參數知識回答)、'Paragraph'(單跳RAG基準測試)或'Document'(多跳RAG基準測試)。
  • 對于圖像基準測試,查詢被標記為'Image'。
  • 對于視頻問答基準測試,查詢被標記為'Clip'(如果查詢關注視頻中的局部事件或特定時刻)或'Video'(如果查詢需要理解整個視頻的故事情節或更廣泛的上下文)。

通用RAG:通過路由模塊對多源異構知識庫檢索生成問答思路-AI.x社區

不同路由器模型大小的路由器準確率

性能效果

通用RAG:通過路由模塊對多源異構知識庫檢索生成問答思路-AI.x社區

通用RAG:通過路由模塊對多源異構知識庫檢索生成問答思路-AI.x社區

在八個多模態數據集上比較 UniversalRAG 模型與基線的總體結果。UniversalRAG(我們的模型)以彩色單元格表示,包含針對 DistilBERT 和 T5-Large 訓練的路由器模型,以及基于 GPT-4o 的免訓練路由器方法。通過自適應地為每個查詢選擇最佳檢索模態,UniversalRAG 的性能與 Oracle 檢索選擇的性能相當,并且平均而言優于所有基線。

通用RAG:通過路由模塊對多源異構知識庫檢索生成問答思路-AI.x社區

通用RAG:通過路由模塊對多源異構知識庫檢索生成問答思路-AI.x社區

檢索粒度對兩個基準測試的性能影響:HotpotQA(需要對文檔進行多跳推理)和 LVBench(其查詢通常可用短視頻片段進行回答)。具有粒度的 UniversalRAG 始終優于無粒度的模型,這突顯了結合不同粒度級別可以增強 UniversalRAG 自適應處理各種用戶問題的能力。

參考:UniversalRAG: Retrieval-Augmented Generation over Multiple Corpora with Diverse Modalities and Granularities,https://arxiv.org/pdf/2504.20734

本文轉載自??大模型自然語言處理??  作者:余俊暉


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-5-14 19:24:03修改
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: av一二三区 | 日本天天操 | 亚洲精品中文在线 | 五月婷婷婷| 精品亚洲一区二区三区四区五区 | aaaa网站| 久久91精品| 日韩精品一区二区三区在线播放 | 黄免费观看视频 | 91精品中文字幕一区二区三区 | 一区二区在线免费播放 | 在线色网站| 日韩精品免费 | 91精品福利 | 午夜a v电影 | 激情福利视频 | 一区二区视频在线观看 | 日韩手机在线看片 | 国产高清在线精品一区二区三区 | 国内激情av片 | 精品一区在线免费观看 | 欧美精品一区二区三区蜜桃视频 | 色视频网站 | 日韩欧美一二三区 | 国产永久免费 | 亚洲最大福利网 | 在线日韩| 国产日韩免费观看 | 欧美激情久久久 | 成人性视频免费网站 | 久久亚洲综合 | 精品熟人一区二区三区四区 | 亚洲乱码一区二区三区在线观看 | 麻豆成人在线视频 | 国产三级一区二区三区 | 国内精品一区二区三区 | 亚洲影音 | 日韩精品在线一区 | av一区在线 | 国产网站在线播放 | 一区二区三区四区日韩 |