成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

理解 RAG 第一部分:為什么需要它

人工智能
RAG 無疑是 LLM 出現后自然語言處理領域的重大突破之一,因為它有效地解決了上述 LLM 的局限性。RAG 的核心理念是將搜索引擎常用的信息檢索技術的準確性和搜索能力與 LLM 的深度語言理解和生成能力相結合。

自然語言處理(NLP) 是人工智能(AI)的一個領域,旨在教會計算機理解人類的書面和口頭語言,并運用這些語言與人類互動。雖然傳統的 NLP 方法已研究數十年,但近年來出現的大型語言模型(LLM) 幾乎主導了該領域的所有發展。LLM 通過將復雜的深度學習架構與能夠分析語言中復雜模式和相互依賴關系的自注意力機制相結合,徹底改變了 NLP 和整個人工智能領域。LLM 能夠處理廣泛的語言生成和語言理解任務,并具有廣泛的應用范圍,例如對話聊天機器人、深度文檔分析、翻譯等等。

LLM 最常執行的一些任務

LLM 的能力和局限性

各大人工智能公司推出的大型通用語言模型(LLM),例如 OpenAI 的 ChatGPT 模型,主要專注于語言生成。也就是說,給定一個提示——用戶用人類語言提出的查詢、問題或請求——LLM 必須逐字逐句地生成該提示的自然語言響應。為了完成這項看似艱巨的任務,LLM 需要基于極其龐大的數據集進行訓練,這些數據集包含數百萬到數十億個文本文檔,涵蓋任何你能想到的主題。通過這種方式,LLM 能夠全面學習人類語言的細微差別,模仿我們的溝通方式,并運用所學知識生成自己的“類人語言”,從而實現前所未有的流暢人機交流。

毫無疑問,大語言模型(LLM)在人工智能發展和視野方面邁出了一大步,但它們也并非沒有局限性。具體來說,如果用戶在特定情境下(例如,最新消息)向大語言模型(LLM)詢問精確的答案,模型本身可能無法提供具體準確的答案。原因在于:大語言模型(LLM)對世界的認知受限于它們接觸的數據,尤其是在訓練階段。除非頻繁地接受訓練(坦白說,這是一個成本極其高昂的過程),否則大語言模型(LLM)通常無法感知最新消息。

更糟糕的是,當LLM缺乏基礎信息來提供精確、相關或真實的答案時,他們很可能會生成看似令人信服的答案,即使這意味著答案完全建立在虛構的信息之上。LLM中經常出現的這種問題被稱為“幻覺”:生成不準確且毫無根據的文本,從而誤導用戶。

RAG 的誕生

即使是市場上規模最大的語言模型(LLM)也在一定程度上遭遇了數據過時、昂貴的再訓練和幻覺問題。科技巨頭們也深知,當這些模型被全球數百萬用戶使用時,它們會帶來風險和影響。例如,早期 ChatGPT 模型中幻覺的發生率估計約為 15%,這對使用這些模型的組織的聲譽產生了深遠的影響,并損害了整個人工智能系統的可靠性和信任度。

這就是RAG(檢索增強生成)應運而生的原因。RAG 無疑是 LLM 出現后自然語言處理領域的重大突破之一,因為它有效地解決了上述 LLM 的局限性。RAG 的核心理念是將搜索引擎常用的信息檢索技術的準確性和搜索能力與 LLM 的深度語言理解和生成能力相結合。

廣義上講,RAG 系統通過在用戶查詢或提示中融入最新且真實的上下文信息來增強 LLM。這些上下文信息是在 LLM 主導的語言理解和后續響應生成過程之前的檢索階段獲得的。

RAG 可以解決 LLM 中常見的上述問題,具體如下:

  • 數據過時:RAG 可以通過檢索和整合來自外部來源的最新信息來幫助克服數據過時問題,從而使響應反映最新的可用知識
  • 再培訓成本:通過動態檢索相關信息,RAG 減少了頻繁且昂貴的再培訓的必要性,使 LLM 無需完全再培訓即可保持最新狀態
  • 幻覺:RAG 通過將反應建立在從真實文檔中檢索到的事實信息上,幫助緩解幻覺,最大限度地減少缺乏真實性的虛假或虛構反應的產生

至此,我們希望您對 RAG 是什么以及它為何出現以改進現有的 LLM 解決方案有了初步的了解。本系列的下一篇文章將深入探討 RAG 流程的一般工作原理。

責任編輯:龐桂玉 來源: 數據驅動智能
相關推薦

2019-04-10 11:06:54

前端HTMLCSS

2009-06-09 14:40:01

Javascript表單驗證

2009-06-11 15:25:39

Java隨機數

2009-06-12 10:34:40

Java Date

2025-01-22 08:01:53

2013-07-08 15:45:04

Python

2009-06-12 10:08:05

StaticJava

2013-04-08 15:42:38

Backbone.js入門

2020-10-10 14:36:10

Python

2018-11-15 14:52:15

Spark數據機器學習

2011-08-03 10:12:38

2013-09-24 10:07:19

Ruby項目

2009-06-15 13:32:18

Java applet插件

2013-11-14 16:18:05

AndroidAudioAudioTrack

2018-12-19 09:03:04

物聯網供應鏈物聯網應用

2009-07-14 13:49:28

Swing組件AWT

2010-03-11 11:29:51

喬布斯

2020-10-12 00:41:52

Python變量

2021-08-19 10:23:56

數據中心電網能源

2024-05-15 08:12:11

SignalJavaScriptPromises
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 噜久寡妇噜噜久久寡妇 | 日韩电影一区 | 国产精品毛片久久久久久久 | 国产一二三区免费视频 | 日韩久草 | 很黄很污的网站 | 黄网站涩免费蜜桃网站 | 99re6在线| 色又黄又爽网站www久久 | 久久69精品久久久久久国产越南 | 国产欧美一区二区三区久久手机版 | 99国产精品久久久久久久 | 一区二区亚洲 | 国产大片一区 | 亚洲天堂男人的天堂 | 91porn国产成人福利 | 日本成人综合 | 欧美8一10sex性hd| 国内精品久久久久久久 | 亚洲视频免费在线播放 | 日韩欧美精品在线 | 欧美黄色片在线观看 | 在线看日韩 | 在线观看av网站 | 超碰人人做| av中文字幕在线观看 | 精品国产一区二区三区性色av | 国产激情视频网站 | 国产精品网址 | 国产日韩欧美一区二区 | 亚洲视频手机在线 | 久久国产精品免费一区二区三区 | 国产成人高清视频 | 狠狠的操| 欧美视频三区 | 国产一区二区久久 | av大片在线观看 | 日日操天天射 | 欧美1区2区| 亚洲综合字幕 | 天堂亚洲网|