TigerGraph CoPilot如何實現圖形增強式AI 原創
通過對比其他商用LLM的缺陷,本文詳細介紹了TigerGraph CoPilot的主要功能、優點、以及兩個關鍵用例。
近年來,數據作為一種生產要素,已經能夠有能力為我們提供橫跨不同行業的變革性商業見解了。不過,如何利用好可以獲得的大數據,往往給我們帶來了不小的挑戰。一面是過載的數據,一面卻是大量未被充分利用的數據孤島。不少專業數據科學家和分析師亟待通過專業知識,讓自己所在的組織能夠在不犧牲性能和運營效率的情況下,及時地處理持續增長的數據,并從復雜的數據中提取潛藏在表層之下的見解。
最近,人工智能(AI)在自然語言處理方面的突破,改變了數據集中化訪問的方式。通過充分利用人工智能CoPilot的實時處理和分析大規模數據的能力,更多的用戶可以輕松地查詢和解釋復雜的數據集,進而有助于組織快速做出明智的決策。同時,人工智能CoPilot也可以通過自動化復雜的數據流程,以及授權較少的技術人員進行深層次的數據分析,管理與控制大型數據集的高昂成本,進而優化資源的整體分配。
不過,生成式AI和大語言模型(LLM并非毫無瑕疵。由于大多數LLM都建立在通用的公共知識的基礎上,因此它們無法知曉特定組織的特定數據,更不用說那些機密數據了。同時,LLM除了無法了解不斷變化的信息世界,另一個更為嚴重的問題是“幻覺”。也就是說,生成式模型在其統計過程所生成的結論,可能只是其一廂情愿,而根本不真實。
可見,我們迫切需要一種更具備上下文相關性、更少出錯的AI,在預測分析和機器學習過程中,提供能夠直接提升業務決策準確度的優質數據。
TigerGraph CoPilot簡介
作為一款AI助手,TigerGraph CoPilot結合了圖形數據庫和生成式AI的功能,旨在提高分析、開發和管理各種業務任務的生產力。TigerGraph CoPilot允許業務分析師、數據科學家、以及開發人員,使用自然語言對大規模的最新數據執行實時查詢,以獲得從自然語言、圖形可視化、以及其他視角來展示和分析的數據見解。
針對前文提到的AI缺陷,TigerGraph CoPilot可以通過提高準確性和減少幻覺,來為組織充分挖掘數據潛力,并在客戶服務、市場營銷、產品銷售、數據科學、開發和工程等領域推動知情決策,真正體現生成式AI應用的價值所在。
TigerGraph CoPilot的主要功能和優勢
- 圖形增強式自然語言查詢
- 針對圖形增強的生成式AI
- 可靠且負責任(相對于幻覺而言)的AI
- 高性能與擴展性
圖形增強式自然語言查詢
TigerGraph CoPilot允許非技術用戶使用日常交流語言對數據進行查詢和分析。這使得他們能夠更專注于挖掘見解,而不必學習新的技術或計算機語言。針對每一個用戶問題,CoPilot都會采用一種新穎的三段式交互方法(如下),同時與TigerGraph數據庫及用戶選擇的LLM進行交互,以獲得準確和相關的回答。
- 在第一階段,TigerGraph CoPilot會將問題與數據庫中可用的特定數據予以比對。具體而言,它會使用LLM將問題與圖形的模式進行比較,并用圖形元素替換問題中的實體。例如,如果有一個頂點(vertex)類型為BareMetalNode,并且用戶詢問“有多少服務器?”,那么問題就會被轉換為“有多少BareMetalNode頂點?”
- 在第二階段,TigerGraph CoPilot使用LLM將轉換后的問題,與一組精心策劃的數據庫查詢與函數進行比較,以選擇最佳匹配。使用預先批準的查詢通常會有兩個好處:
首先,由于每個查詢的含義和行為都經歷了驗證,因此它們有效地降低了產生幻覺的可能性。
其次,該系統具有預測回答問題所要調用的執行資源的潛力。
- 在第三階段,TigerGraph CoPilot會執行那些已識別的查詢,并以自然語言返回相關結果,及其背后運作的推理。同時,CoPilot的圖形增強式自然語言查詢,提供了良好的屏障,既能降低模型幻覺的風險,又可澄清每個查詢的含義,還會提供對結果的理解。
針對圖形增強的生成式AI
TigerGraph CoPilot可以基于用戶自己的文檔和數據,創建帶有圖形增強AI的聊天機器人,且無需現有的圖形數據庫。在這種操作模式下,TigerGraph CoPilot會通過資源材料來構建知識圖,并應用其獨特的檢索增強生成(RAG)的變體,來提高自然語言問題答案的上下文相關性和準確性。
首先,在加載用戶文檔時,TigerGraph CoPilot會從文檔塊中提取實體和關系,并從文檔中構造出知識圖。知識圖往往通過關系連接數據點,以結構化的格式來組織信息。同時,CoPilot還會識別概念,構建本體,向知識圖中添加語義和推理。當然,用戶也可以提供自己的概念本體。
然后,通過使用該綜合知識圖,CoPilot會執行混合檢索,即:結合傳統的矢量搜索和圖形遍歷,來收集更多的相關信息和更為豐富的上下文,以回答用戶的各類問題。
通過將數據組織為知識圖,聊天機器人可以快速且高效地訪問到準確的、基于事實的信息,從而減少了對于需要根據培訓過程的學習模式,來生成響應的依賴。畢竟,這樣的模式有時可能并不正確、甚至已經過時。
可靠且負責任的AI
如前文所述,TigerGraph CoPilot通過允許LLM管理查詢,來訪問圖形數據庫,以緩解幻覺。同時,它能夠通過采取相同的、基于角色的訪問控制和安全措施(已經成為了TigerGraph數據庫的一部分),來確保實現負責任的AI。此外,TigerGraph CoPilot還通過開放其主要組件,并允許用戶選擇其LLM服務,來保持開放性和透明性。
高性能與擴展性
通過利用TigerGraph數據庫,TigerGraph CoPilot為圖形分析提供了較高的性能。而作為一個基于圖形的RAG解決方案,它也為知識圖驅動的問答提供了大規模的可擴展的知識庫。
TigerGraph CoPilot關鍵用例
- 從自然語言到數據見解
- 內容豐富的問答
從自然語言到數據見解
無論您是業務分析師、數據專家、還是調查人員,TigerGraph CoPilot都能夠讓您快速地從數據中獲取信息和見解。例如,CoPilot可以通過回答“請給我展示最近誤報的欺詐案件列表”等問題,為欺詐調查人員生成相關報告。同時,CoPilot也可以促進更準確的調查,例如:“誰在過去一個月里,與123賬戶進行了金額超過1000美元的交易?”
TigerGraph CoPilot甚至可以通過沿著依賴關系去遍歷圖形,以回答諸如“如果……會怎么樣”等問題。例如,您可以從供應鏈圖中,輕松找到“哪些供應商可以彌補部件123的短缺?”或從數字基礎設施圖中,找到“哪些服務會受到服務器321升級的影響?”
內容豐富的問答
TigerGraph CoPilot在為用戶的數據和文檔構建問答聊天機器人時,能夠基于知識圖的RAG方法,實現上下文信息的準確檢索,以便給出更好的答案和更明智的決策??梢哉f,由CoPilot給出的、內容豐富的問答,直接提高了典型問答應用(如:呼叫中心、客戶服務、以及知識搜索等場景)的生產力,并且降低了構建成本。
此外,通過將文檔知識圖和現有的業務圖(如:產品圖)合并為一個智能圖,TigerGraph CoPilot可以解決其他RAG方案所無法應對的問題。例如,通過將客戶的購買歷史與產品圖表相結合,CoPilot可以在客戶鍵入搜索查詢、或要求推薦時,做出更加準確的個性化建議。其典型場景包括:通過將患者的病史與健康圖表相結合,醫生或健康專家便可以獲得有關患者的更多實用信息,以提供更好的診斷或治療。
小結
綜上所述,相比其他商用LLM應用,TigerGraph CoPilot解決了復雜數據管理與相關分析的挑戰。通過它在自然語言處理和高級算法方面的強大功能,組織可以在克服數據過載和應對數據訪問欠佳方面,獲取巨大的業務洞察。同時,通過利用基于圖形的RAG,它也可以確保LLM輸出的準確性和相關性。
鑒于CoPilot允許更廣泛的用戶有效地利用數據,做出明智的決策,并能優化組織間的資源分配。我們認為,這是在實現數據訪問民主化,以及賦能組織充分利用其數據資產潛力方面的重大進步。
譯者介紹
陳峻(Julian Chen),51CTO社區編輯,具有十多年的IT項目實施經驗,善于對內外部資源與風險實施管控,專注傳播網絡與信息安全知識與經驗。
原文標題:How TigerGraph CoPilot enables graph-augmented AI,作者:Hamid Azzawe
鏈接:https://www.infoworld.com/article/3715344/how-tigergraph-copilot-enables-graph-augmented-ai.html。
