Gemini 1.5 殺死了 RAG ?

作者：言征 2024-02-26 00:00:00

“過去幾天里，我看到的最糟糕的論調是，像Gemini 1.5這樣的長上下文模型將取代RAG，”DAIR.AI的聯合創始人Elvis Saravia寫道。他解釋說，長上下文LLM在處理靜態信息（如書籍、視頻錄制、PDF等）方面表現出色，但它們尚未在高度演化的信息和知識上進行實戰測試。

撰稿 | 言征

出品 | 51CTO技術棧（微信號：blog51cto）

谷歌最近發布的Gemini 1.5具有1M的上下文長度窗口，引發了一場關于“RAG（檢索增強生成）是否仍然重要”的新辯論。

眾所周知，LLM面臨的最大問題之一就是幻覺。為了應對這一挑戰，市面上有兩種解決方案，一種涉及增加上下文窗口，另一種就是使用RAG。

最近，一些開發人員一直在試驗Gemini 1.5。沃頓商學院教授Ethan Mollick在X上寫道：“我上傳了《了不起的蓋茨比》，其中有兩處改動（提到了一部‘盒子里的iPhone’和一架‘激光割草機’）。Gemini發現了這兩處問題（又找到了一件東西）。Claude也做到了，但產生了幻覺。而帶有RAG的GPT4卻失靈了。”

Gemini的測試結果

Claude的測試結果

RAG + GPT4

另一位X用戶Mckay Wrigley將一整本生物學教科書輸入Gemini 1.5 Pro，其中包括491002個令牌。他問了三個非常具體的問題，每個問題的答案都是100%正確的。

Cognosys聯合創始人兼首席執行官Sully Omar寫道：“Gemini 1.5 Pro是一款被嚴重低估的軟件。我直接從GitHub上傳了整個代碼庫，以及所有問題，包括Vercel AI SDK。它不僅能夠理解代碼庫，還發現了最緊迫的問題并實施了修復。它幾乎革新改變一切。”

上面的三個例子證明，Gemini 1.5憑借其廣泛的上下文窗口，成功地檢索了文檔中的關鍵信息。

1、Gemini1.5性能超越了于ChatGPT和Claud, 上下文窗口遙遙領先

具體來講，之所以谷歌的Gemini 1.5這個新模型的性能優于ChatGPT和Claude，一個顯著的原因是擁有100萬個令牌上下文窗口，這是自然處理模型中有史以來最大的。相比之下，GPT-4 Turbo具有128K上下文窗口，而Claude 2.1具有200K上下文窗口。

部分受邀的開發者和企業客戶可以通過AI Studio和Vertex AI在私人預覽中，在多達100萬個令牌的上下文窗口中進行嘗試。它可以一次性處理大量信息，包括1小時的視頻、11小時的音頻、超過30000行代碼或超過700000字的代碼庫。在他們的研究中，谷歌還成功測試了多達1000萬個令牌。

圖片

該博客由谷歌首席執行官桑達爾·皮查伊和谷歌DeepMind首席執行官德米斯·哈薩比斯共同撰寫，并將其與ChatGPT和Claude等現有模型進行了比較。

2、蘋果和橙子的比較

然而，上面的這三個例子并不能說明RAG的局限性。

RAG和上下文窗口之間的方案有哪些區別？上下文窗口將模型限制為給定文本范圍內的信息，而RAG將模型的功能擴展到外部來源，極大地拓寬了可訪問信息的范圍。

對于互聯網上相關的炒作報道，谷歌DeepMind研究和深度學習團隊負責人Oriol Vinyals表達了他的觀點，他說：“RAG（檢索增強生成）還沒有完成，盡管我們現在可以在上下文中處理100萬或更多的令牌。事實上，RAG有一些很好的特性，可以增強（并通過）長上下文來增強。

他補充道：“RAG允許您查找相關信息，但由于壓縮，模型訪問信息的方式可能過于受限。長上下文可能有助于彌合這一差距，類似于現代CPU中L1/L2緩存和主存儲器的協同工作方式。”

圖片

更大的上下文窗口允許LLM考慮更多的文本，從而生成更準確、連貫的響應，尤其是對于復雜和長句。然而，這并不意味著模型不會產生幻覺。

根據斯坦福大學、加州大學伯克利分校和Samaya AI的研究人員發表的一篇題為《中部低谷：語言模型如何使用長上下文》的論文，LLM在文檔的開頭和結尾都表現出很高的信息檢索準確性。然而，這種精度在中間會下降，尤其是隨著輸入處理的增加。

圖片

3、超長上下文窗口殺不死RAG

他進一步補充說，為了解決這類問題，人們可能會將RAG和長上下文LLM結合起來，構建一個健壯的系統，該系統可以有效、高效地檢索和執行大規模的關鍵歷史信息分析。

“我們將在解決一些挑戰方面取得進展，例如‘中部低谷’和處理更復雜的結構化和動態數據，但我們仍然還有很長的路要走，”他說。Saravia補充說，不同的LLM家族將有助于解決不同類型的問題。“我們需要摒棄這種想法，即將有一種LLM能夠統治一切。”

毫無疑問，Gemini 1.5的性能優于Claude 2.1和GPT-4 Turbo，因為它可以吸收整個代碼庫，處理100多篇論文和各種文檔，但它肯定沒有殺死RAG。

參考鏈接：

https://analyticsindiamag.com/did-google-gemini-1-5-really-kill-rag/

責任編輯：武曉燕來源： 51CTO技術棧

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Gemini 1.5 殺死了 RAG ?

1、Gemini1.5性能超越了于ChatGPT和Claud, 上下文窗口遙遙領先

2、蘋果和橙子的比較

3、超長上下文窗口殺不死RAG