成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

LongRAG:利用長上下文LLMs增強檢索增強生成

人工智能
LongRAG框架通過引入長檢索器和長閱讀器,減輕了檢索器的負擔,提高了檢索質量和全文問答性能。該框架在不進行任何訓練的情況下,達到了與最先進的全訓練RAG模型相當的性能。

前言

現有的RAG框架通常使用100詞的短段落作為檢索單元,這種設計使得檢索器需要在大量語料庫中搜索,增加了工作負擔,并且容易引入難負樣本,影響性能。LongRAG框架為了解決這一問題,該框架使用長檢索單元(最多4K詞),顯著減少了語料庫的大?。◤?2M減少到600K),從而減輕了檢索器的負擔,并提高了檢索性能。

圖片圖片

一、方法

LongRAG框架由兩個主要組件構成:長檢索器(Long Retriever)和長閱讀器(Long Reader)。LongRAG框架的目標是通過使用長檢索單元來平衡檢索器和閱讀器之間的工作負載,并利用長上下文語言模型的能力。

圖片圖片

  1. 長檢索單元:LongRAG框架通過組合整個文檔或相關文檔組來形成長檢索單元,這些單元的長度超過4K個token。如果原始文檔已經很長(例如超過4K個令牌),則將其視為一個單一的檢索單元。對于較短的文檔,則通過相關文檔分組來形成單個檢索單元。下面是一種用于將多個短文檔分組以形成長檢索單元的算法:

圖片圖片

  1. 算法的核心思想是根據文檔之間的相關性將它們分組,以便在長檢索單元中保留更多的上下文信息。
  2. 長檢索器:長檢索器的任務是在整個語料庫中搜索相關的上下文信息,而不是尋找精確的細粒度短上下文。檢索過程分為三個步驟:形成長檢索單元、相似性搜索和聚合檢索結果。相似性搜索使用編碼器將查詢和檢索單元映射到向量空間,并通過點積計算它們之間的相似性。聚合檢索結果時,將前K個最相似的檢索單元連接起來作為長上下文。

相似性搜索:使用編碼器EQ(·)將輸入問題映射到d維向量,使用另一個編碼器EC(·)將檢索單元映射到d維向量。定義問題和檢索單元之間的相似性為向量的點積:

圖片圖片

由于g的長度較長,采用近似方法(通過最大化檢索單元內所有片段的得分來近似):

圖片圖片

聚合檢索結果:將前k個檢索單元連接成長上下文作為檢索結果:

圖片圖片

  1. 長閱讀器:長閱讀器將檢索到的結果(約30K詞)輸入現有的長上下文LLM中進行零樣本答案生成。不需要任何訓練,流程如下:提示設計:為了有效地從長上下文中提取答案,長閱讀器采用了兩步提示法:

圖片圖片

  1. 提示詞模版

第一步提示:將問題和長檢索結果拼接后輸入到長語言模型中,不使用任何上下文示例。長語言模型生成一個較長的初步答案。

第二步提示:使用8個上下文示例來引導長語言模型從長答案中提取最終的簡短答案。

  1. 輸入:將相關指令、問題和長檢索結果輸入到長語言模型中。

  2. 初始答案生成:長語言模型首先生成一個較長的答案,這個答案通常包含幾句話。

  3. 答案精煉:通過進一步的提示,長語言模型從初始的長答案中提取出最終的簡短答案。

二、實驗

在基于維基百科的數據集上,LongRAG框架在不進行任何訓練的情況下,達到了與最先進的全訓練RAG模型相當的性能。在非基于維基百科的數據集上,LongRAG框架也表現出色,顯著優于傳統的RAG框架。

圖片圖片

圖片圖片

消融實驗,驗證了長檢索單元和長閱讀器在提高性能方面的有效性。發現檢索單元大小和閱讀器變體對性能有顯著影響。

圖片圖片

總結

LongRAG框架通過引入長檢索器和長閱讀器,減輕了檢索器的負擔,提高了檢索質量和全文問答性能。該框架在不進行任何訓練的情況下,達到了與最先進的全訓練RAG模型相當的性能??偟膩碚f,LongRAG是一種檢索和生成平衡的方法,供參考。

責任編輯:武曉燕 來源: 大模型自然語言處理
相關推薦

2025-02-11 08:00:00

大語言模型檢索增強生成CAG

2024-05-20 08:31:33

檢索增強生成LLM大型語言模型

2023-10-14 17:46:17

RAG提示工程GPT-3

2025-01-23 16:23:30

2025-04-01 09:25:09

2024-09-30 14:10:00

2025-04-29 08:20:51

2024-04-30 16:17:34

RAGLLM

2024-06-18 15:36:50

2023-09-11 09:00:00

檢索增強生成大數據模型自然語言處理

2025-03-19 08:43:17

檢索增強生成RAG大型語言模型

2024-12-23 11:31:05

大模型檢索人工智能

2023-10-27 10:23:35

大語言模型人工智能

2024-02-18 09:00:00

RAG工具LlamaIndexChatGPT

2024-04-03 10:05:00

LLM性能基準測試

2023-10-31 16:37:55

大型語言模型人工智能

2025-02-13 09:01:03

2024-10-31 14:46:31

2025-05-28 01:25:00

RAG人工智能語言模型

2024-11-19 13:05:40

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产成人网| 在线成人免费视频 | 九九热免费视频在线观看 | 久色激情| 一区二区在线看 | 欧美一卡二卡在线观看 | 国产精品成人一区二区三区 | 中文在线а√在线8 | 91www在线观看 | 国产精品视频网 | 五月综合久久 | 久久一区二区三区电影 | 日一区二区 | 欧美日韩不卡合集视频 | 国产精品国产成人国产三级 | 日本午夜精品一区二区三区 | 国产精品污www一区二区三区 | 免费网站在线 | 亚洲国产精品91 | 福利视频一区二区 | 国产精品99久久久久久动医院 | 日韩国产中文字幕 | 九九伊人sl水蜜桃色推荐 | 在线观看免费av网 | h视频在线播放 | 欧美三级电影在线播放 | 三级在线免费 | 精品久久久一区二区 | 精品久久久久久久人人人人传媒 | 日本一二三区在线观看 | 久热中文字幕 | 污视频在线免费观看 | 国产日韩欧美一区二区 | 精品国产视频在线观看 | 久久一久久| 久久蜜桃av | 在线资源视频 | 国产一区三区视频 | 色综合久久88色综合天天 | 81精品国产乱码久久久久久 | av在线一区二区三区 |