成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Gemini 1.5 殺死了 RAG ?

原創
開發 前端
“過去幾天里,我看到的最糟糕的論調是,像Gemini 1.5這樣的長上下文模型將取代RAG,”DAIR.AI的聯合創始人Elvis Saravia寫道。他解釋說,長上下文LLM在處理靜態信息(如書籍、視頻錄制、PDF等)方面表現出色,但它們尚未在高度演化的信息和知識上進行實戰測試。

撰稿 | 言征

出品 | 51CTO技術棧(微信號:blog51cto)

谷歌最近發布的Gemini 1.5具有1M的上下文長度窗口,引發了一場關于“RAG(檢索增強生成)是否仍然重要”的新辯論。

眾所周知,LLM面臨的最大問題之一就是幻覺。為了應對這一挑戰,市面上有兩種解決方案,一種涉及增加上下文窗口,另一種就是使用RAG。

最近,一些開發人員一直在試驗Gemini 1.5。沃頓商學院教授Ethan Mollick在X上寫道:“我上傳了《了不起的蓋茨比》,其中有兩處改動(提到了一部‘盒子里的iPhone’和一架‘激光割草機’)。Gemini發現了這兩處問題(又找到了一件東西)。Claude也做到了,但產生了幻覺。而帶有RAG的GPT4卻失靈了。”

Gemini的測試結果Gemini的測試結果

Claude的測試結果Claude的測試結果

RAG + GPT4RAG + GPT4

另一位X用戶Mckay Wrigley將一整本生物學教科書輸入Gemini 1.5 Pro,其中包括491002個令牌。他問了三個非常具體的問題,每個問題的答案都是100%正確的。 

Cognosys聯合創始人兼首席執行官Sully Omar寫道:“Gemini 1.5 Pro是一款被嚴重低估的軟件。我直接從GitHub上傳了整個代碼庫,以及所有問題,包括Vercel AI SDK。它不僅能夠理解代碼庫,還發現了最緊迫的問題并實施了修復。它幾乎革新改變一切。”

上面的三個例子證明,Gemini 1.5憑借其廣泛的上下文窗口,成功地檢索了文檔中的關鍵信息。

1、Gemini1.5性能超越了于ChatGPT和Claud, 上下文窗口遙遙領先

具體來講,之所以谷歌的Gemini 1.5這個新模型的性能優于ChatGPT和Claude,一個顯著的原因是擁有100萬個令牌上下文窗口,這是自然處理模型中有史以來最大的。相比之下,GPT-4 Turbo具有128K上下文窗口,而Claude 2.1具有200K上下文窗口。 

部分受邀的開發者和企業客戶可以通過AI Studio和Vertex AI在私人預覽中,在多達100萬個令牌的上下文窗口中進行嘗試。 它可以一次性處理大量信息,包括1小時的視頻、11小時的音頻、超過30000行代碼或超過700000字的代碼庫。在他們的研究中,谷歌還成功測試了多達1000萬個令牌。

圖片圖片

該博客由谷歌首席執行官桑達爾·皮查伊和谷歌DeepMind首席執行官德米斯·哈薩比斯共同撰寫,并將其與ChatGPT和Claude等現有模型進行了比較。 

2、蘋果和橙子的比較

然而,上面的這三個例子并不能說明RAG的局限性。

RAG和上下文窗口之間的方案有哪些區別?上下文窗口將模型限制為給定文本范圍內的信息,而RAG將模型的功能擴展到外部來源,極大地拓寬了可訪問信息的范圍。

對于互聯網上相關的炒作報道,谷歌DeepMind研究和深度學習團隊負責人Oriol Vinyals表達了他的觀點,他說:“RAG(檢索增強生成)還沒有完成,盡管我們現在可以在上下文中處理100萬或更多的令牌。事實上,RAG有一些很好的特性,可以增強(并通過)長上下文來增強。

他補充道:“RAG允許您查找相關信息,但由于壓縮,模型訪問信息的方式可能過于受限。長上下文可能有助于彌合這一差距,類似于現代CPU中L1/L2緩存和主存儲器的協同工作方式。”

圖片圖片

更大的上下文窗口允許LLM考慮更多的文本,從而生成更準確、連貫的響應,尤其是對于復雜和長句。然而,這并不意味著模型不會產生幻覺。 

根據斯坦福大學、加州大學伯克利分校和Samaya AI的研究人員發表的一篇題為《中部低谷:語言模型如何使用長上下文》的論文,LLM在文檔的開頭和結尾都表現出很高的信息檢索準確性。然而,這種精度在中間會下降,尤其是隨著輸入處理的增加。

圖片圖片

3、超長上下文窗口殺不死RAG

“過去幾天里,我看到的最糟糕的論調是,像Gemini 1.5這樣的長上下文模型將取代RAG,”DAIR.AI的聯合創始人Elvis Saravia寫道。他解釋說,長上下文LLM在處理靜態信息(如書籍、視頻錄制、PDF等)方面表現出色,但它們尚未在高度演化的信息和知識上進行實戰測試。

他進一步補充說,為了解決這類問題,人們可能會將RAG和長上下文LLM結合起來,構建一個健壯的系統,該系統可以有效、高效地檢索和執行大規模的關鍵歷史信息分析。

“我們將在解決一些挑戰方面取得進展,例如‘中部低谷’和處理更復雜的結構化和動態數據,但我們仍然還有很長的路要走,”他說。Saravia補充說,不同的LLM家族將有助于解決不同類型的問題。“我們需要摒棄這種想法,即將有一種LLM能夠統治一切。”

毫無疑問,Gemini 1.5的性能優于Claude 2.1和GPT-4 Turbo,因為它可以吸收整個代碼庫,處理100多篇論文和各種文檔,但它肯定沒有殺死RAG。

參考鏈接:

https://analyticsindiamag.com/did-google-gemini-1-5-really-kill-rag/

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2019-12-27 14:00:43

傳統IT商業模式

2022-12-26 09:00:07

2014-08-07 10:39:38

諾基亞蘋果

2024-05-20 08:57:21

谷歌OpenAI搜索

2019-06-05 13:00:00

2009-11-09 09:44:13

北電CEO

2022-12-15 10:44:35

2009-11-10 09:34:32

誰殺死了北電前任高管

2009-11-11 09:56:54

北電電信公司

2020-04-13 14:10:40

工具軟件互聯網

2024-02-27 11:47:44

AI數據

2019-04-07 16:33:21

云計算行業科技

2009-11-20 12:54:42

2021-02-06 08:00:00

網絡安全WebWAF

2025-06-03 02:55:00

2024-07-15 08:38:00

2009-11-20 13:01:05

2009-11-20 12:39:05

2024-10-30 13:40:00

2009-11-20 14:45:34

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产一级精品毛片 | 欧美日韩一区二区在线 | 成人在线电影在线观看 | 日韩欧美国产一区二区三区 | 欧美一级大片 | 天天草草草| 天天干狠狠操 | www操操| 成人免费视频一区 | 日韩亚洲视频 | 日韩在线一区二区 | 性欧美精品一区二区三区在线播放 | 久久久av | 一区二区三区精品 | 天堂网中文字幕在线观看 | 中文字幕乱码一区二区三区 | 福利网站导航 | 人人干人人爽 | 亚洲综合色网 | 亚洲国产成人av好男人在线观看 | 国产精品久久久久久久久久久久冷 | 真人一级毛片 | 国产在线观看一区二区三区 | 久久久xx | av福利网 | 日日操夜夜操天天操 | 久久久久久久一区 | 欧美激情啪啪 | 久久9热| 国产一区二区三区视频 | 精品国产一区二区三区久久久久久 | 欧美片网站免费 | 日韩中文字幕在线观看 | 超碰97人人人人人蜜桃 | 成人免费网站在线 | 日韩一区二区在线视频 | 农村黄性色生活片 | 美女视频三区 | 国产精品亚洲综合 | 日韩色图在线观看 | 欧美日韩国产精品一区 |