編輯 | 言征
出品 | 51CTO技術(shù)棧(微信號:blog51cto)
企業(yè)部署GenAI需要RAG,而RAG需要向量數(shù)據(jù)庫,向量數(shù)據(jù)庫已經(jīng)成為企業(yè)部署人工智能的核心要素。但這還遠(yuǎn)遠(yuǎn)不夠,企業(yè)級別的RAG要復(fù)雜得多。
1.向量數(shù)據(jù)庫并非真正的難點(diǎn)
克里斯·拉蒂默(Chris Latimer)是初創(chuàng)公司Vectorize的首席執(zhí)行官兼聯(lián)合創(chuàng)始人,他曾在DataStax工作數(shù)年,期間協(xié)助領(lǐng)導(dǎo)了該數(shù)據(jù)庫供應(yīng)商的云端工作。他反復(fù)遇到的一個問題是,對于實(shí)現(xiàn)企業(yè)RAG而言,向量數(shù)據(jù)庫并非真正的難點(diǎn)所在。問題的難點(diǎn)在于,如何將以各種方式存在的非結(jié)構(gòu)化數(shù)據(jù)優(yōu)化并導(dǎo)入向量數(shù)據(jù)庫,以便為生成式人工智能(AI)提供良好的支持。
正因如此,拉蒂默僅在十個月前創(chuàng)立了Vectorize,旨在幫助解決這一挑戰(zhàn)。
現(xiàn)在,該公司聲稱在由True Ventures領(lǐng)投的種子輪融資中籌集了360萬美元。與此同時,該公司還宣布其企業(yè)RAG平臺已正式推出。Vectorize平臺能夠?qū)崿F(xiàn)代理式RAG方法,提供近乎實(shí)時的數(shù)據(jù)能力。
Vectorize專注于AI的數(shù)據(jù)工程方面。該平臺幫助公司為在向量數(shù)據(jù)庫和大型語言模型中使用數(shù)據(jù)做好準(zhǔn)備并進(jìn)行維護(hù)。Vectorize平臺還通過直觀的界面,使企業(yè)能夠快速構(gòu)建RAG數(shù)據(jù)管道。另一項(xiàng)核心功能是RAG評估功能,它允許企業(yè)測試不同的方法。
“我們不斷看到人們在他們的生成式AI項(xiàng)目開發(fā)周期結(jié)束時發(fā)現(xiàn),項(xiàng)目并未取得良好效果,”Vectorize的聯(lián)合創(chuàng)始人兼首席執(zhí)行官克里斯·拉蒂默在接受VentureBeat獨(dú)家采訪時表示。“他們?yōu)橄蛄繑?shù)據(jù)庫獲取的上下文對大型語言模型來說并非最有用的,它仍在產(chǎn)生幻覺或誤解數(shù)據(jù)。”
2.Vectorize如何融入企業(yè)RAG架構(gòu)
Vectorize本身并不是一個向量數(shù)據(jù)庫。相反,它是一個將非結(jié)構(gòu)化數(shù)據(jù)源連接到現(xiàn)有向量數(shù)據(jù)庫(如Pinecone、DataStax、Couchbase和Elastic)的平臺。
拉蒂默解釋說,Vectorize會吸收并優(yōu)化來自不同源的數(shù)據(jù),以供向量數(shù)據(jù)庫使用。該平臺將提供一個生產(chǎn)就緒的數(shù)據(jù)管道,負(fù)責(zé)數(shù)據(jù)攝取、同步、錯誤處理以及其他數(shù)據(jù)工程的最佳實(shí)踐。
Vectorize本身也不是一種向量嵌入技術(shù)。將數(shù)據(jù)(無論是文本、圖像還是音頻)轉(zhuǎn)換為向量的過程,就是向量嵌入的全部內(nèi)容。Vectorize幫助用戶評估不同的嵌入模型和數(shù)據(jù)分塊方法,以確定最適合企業(yè)特定用例和數(shù)據(jù)的配置。
拉蒂默解釋說,Vectorize允許用戶從任意數(shù)量的不同嵌入模型中進(jìn)行選擇。這些不同的模型可能包括OpenAI的ada,甚至是Snowflake正在采用的Voyage AI嵌入。
“我們確實(shí)會考慮將數(shù)據(jù)向量化的創(chuàng)新方法,以確保您獲得最佳結(jié)果,”拉蒂默說,“但最終,我們認(rèn)為其價值在于為企業(yè)和開發(fā)人員提供一個生產(chǎn)就緒的解決方案,讓他們不必再擔(dān)心數(shù)據(jù)工程方面的問題。”
3.利用代理式AI驅(qū)動企業(yè)RAG落地
Vectorize的一項(xiàng)關(guān)鍵創(chuàng)新是其“代理式RAG”方法。該方法將傳統(tǒng)的RAG技術(shù)與AI代理功能相結(jié)合,使應(yīng)用程序能夠更自主地解決問題。
代理式RAG也并非一個假設(shè)性的概念。Vectorize的早期用戶之一、AI推理硅芯片初創(chuàng)公司Groq就已經(jīng)在使用它。Groq最近籌集了6.4億美元資金。Groq正在利用Vectorize的代理式RAG功能來驅(qū)動一個AI支持代理。該代理可以自主利用Vectorize數(shù)據(jù)管道提供的數(shù)據(jù)和上下文來解決客戶問題。
“如果客戶的問題之前已經(jīng)被問過并得到了回答,那么我們希望這個代理能夠解決客戶的問題,而無需人類介入,”拉蒂默說,“但如果代理無法解決問題,我們希望有一個人類參與的環(huán)節(jié),以便進(jìn)行升級處理。因此,代理能夠通過推理來解決問題的理念,正是AI代理架構(gòu)背后的整體理念。”
4.為什么實(shí)時數(shù)據(jù)管道對企業(yè)RAG至關(guān)重要
企業(yè)使用檢索增強(qiáng)生成的一個主要原因是連接到其自身的數(shù)據(jù)源。但同樣重要的是確保數(shù)據(jù)的實(shí)時性。
“陳舊的數(shù)據(jù)會導(dǎo)致陳舊的決策,”拉蒂默說。Vectorize提供了實(shí)時和近乎實(shí)時的數(shù)據(jù)更新能力,客戶可以根據(jù)自身對數(shù)據(jù)陳舊度的容忍度進(jìn)行配置。
“我們實(shí)際上允許用戶根據(jù)對數(shù)據(jù)陳舊度的容忍度和對實(shí)時數(shù)據(jù)的需求來配置平臺,”他說,“因此,如果您只需要將管道設(shè)置為每周運(yùn)行一次,我們可以滿足您的需求;而如果您需要實(shí)時運(yùn)行,我們也可以滿足,并且您可以在數(shù)據(jù)可用時立即獲得實(shí)時更新。”
參考鏈接:https://venturebeat.com/ai/vectorize-debuts-agentic-rag-platform-for-real-time-enterprise-data/