RAG真正的難點不是向量數據庫,而是實時企業數據管道!這家公司做到了 原創
編輯 | 言征
出品 | 51CTO技術棧(微信號:blog51cto)
企業部署GenAI需要RAG,而RAG需要向量數據庫,向量數據庫已經成為企業部署人工智能的核心要素。但這還遠遠不夠,企業級別的RAG要復雜得多。
1.向量數據庫并非真正的難點
克里斯·拉蒂默(Chris Latimer)是初創公司Vectorize的首席執行官兼聯合創始人,他曾在DataStax工作數年,期間協助領導了該數據庫供應商的云端工作。他反復遇到的一個問題是,對于實現企業RAG而言,向量數據庫并非真正的難點所在。問題的難點在于,如何將以各種方式存在的非結構化數據優化并導入向量數據庫,以便為生成式人工智能(AI)提供良好的支持。
正因如此,拉蒂默僅在十個月前創立了Vectorize,旨在幫助解決這一挑戰。
現在,該公司聲稱在由True Ventures領投的種子輪融資中籌集了360萬美元。與此同時,該公司還宣布其企業RAG平臺已正式推出。Vectorize平臺能夠實現代理式RAG方法,提供近乎實時的數據能力。
Vectorize專注于AI的數據工程方面。該平臺幫助公司為在向量數據庫和大型語言模型中使用數據做好準備并進行維護。Vectorize平臺還通過直觀的界面,使企業能夠快速構建RAG數據管道。另一項核心功能是RAG評估功能,它允許企業測試不同的方法。
“我們不斷看到人們在他們的生成式AI項目開發周期結束時發現,項目并未取得良好效果,”Vectorize的聯合創始人兼首席執行官克里斯·拉蒂默在接受VentureBeat獨家采訪時表示。“他們為向量數據庫獲取的上下文對大型語言模型來說并非最有用的,它仍在產生幻覺或誤解數據。”
2.Vectorize如何融入企業RAG架構
Vectorize本身并不是一個向量數據庫。相反,它是一個將非結構化數據源連接到現有向量數據庫(如Pinecone、DataStax、Couchbase和Elastic)的平臺。
拉蒂默解釋說,Vectorize會吸收并優化來自不同源的數據,以供向量數據庫使用。該平臺將提供一個生產就緒的數據管道,負責數據攝取、同步、錯誤處理以及其他數據工程的最佳實踐。
Vectorize本身也不是一種向量嵌入技術。將數據(無論是文本、圖像還是音頻)轉換為向量的過程,就是向量嵌入的全部內容。Vectorize幫助用戶評估不同的嵌入模型和數據分塊方法,以確定最適合企業特定用例和數據的配置。
拉蒂默解釋說,Vectorize允許用戶從任意數量的不同嵌入模型中進行選擇。這些不同的模型可能包括OpenAI的ada,甚至是Snowflake正在采用的Voyage AI嵌入。
“我們確實會考慮將數據向量化的創新方法,以確保您獲得最佳結果,”拉蒂默說,“但最終,我們認為其價值在于為企業和開發人員提供一個生產就緒的解決方案,讓他們不必再擔心數據工程方面的問題。”
3.利用代理式AI驅動企業RAG落地
Vectorize的一項關鍵創新是其“代理式RAG”方法。該方法將傳統的RAG技術與AI代理功能相結合,使應用程序能夠更自主地解決問題。
代理式RAG也并非一個假設性的概念。Vectorize的早期用戶之一、AI推理硅芯片初創公司Groq就已經在使用它。Groq最近籌集了6.4億美元資金。Groq正在利用Vectorize的代理式RAG功能來驅動一個AI支持代理。該代理可以自主利用Vectorize數據管道提供的數據和上下文來解決客戶問題。
“如果客戶的問題之前已經被問過并得到了回答,那么我們希望這個代理能夠解決客戶的問題,而無需人類介入,”拉蒂默說,“但如果代理無法解決問題,我們希望有一個人類參與的環節,以便進行升級處理。因此,代理能夠通過推理來解決問題的理念,正是AI代理架構背后的整體理念。”
4.為什么實時數據管道對企業RAG至關重要
企業使用檢索增強生成的一個主要原因是連接到其自身的數據源。但同樣重要的是確保數據的實時性。
“陳舊的數據會導致陳舊的決策,”拉蒂默說。Vectorize提供了實時和近乎實時的數據更新能力,客戶可以根據自身對數據陳舊度的容忍度進行配置。
“我們實際上允許用戶根據對數據陳舊度的容忍度和對實時數據的需求來配置平臺,”他說,“因此,如果您只需要將管道設置為每周運行一次,我們可以滿足您的需求;而如果您需要實時運行,我們也可以滿足,并且您可以在數據可用時立即獲得實時更新。”
參考鏈接:https://venturebeat.com/ai/vectorize-debuts-agentic-rag-platform-for-real-time-enterprise-data/
本文轉載自??51CTO技術棧??,作者:言征
