企業數據在生成人工智能中的關鍵作用
大量基于GenAI的工具和應用涌入市場。其中一些應用非常聰明且富有創意,但它們大多是ChatGPT等應用背后的大型語言模型(LLM)的包裝器。這并不是要貶低LLM的語言、概念和單詞關系知識可以提供新的效率和生產力的數千種潛在場景。
但LLM和ChatGPT無法解決組織的所有信息問題。機器學習是人工智能應用的核心。企業技術堆棧中的傳統工具(例如ERP、數據倉庫、電子商務和內容/知識管理)越來越多地將機器學習納入核心功能。
檢索增強生成(RAG)
檢索增強生成(RAG)克服了這些限制。這種方法使用企業的數據作為事實來源。它不依賴于LLM對世界的了解,而是解釋用戶的查詢,通過多種機制之一檢索信息,并使答案易于人類理解和對話。但它需要組織的信息作為參考點——企業真相的來源,這是競爭差異化的源泉。
這些信息是什么樣的?它從客戶、交易和產品數據和內容以及目標市場特有的知識和專業知識以及企業的核心能力開始。您如何解決客戶遇到的問題?您如何通過產品和服務吸引目標客戶?您的供應商關系和供應鏈理解如何幫助您擊敗競爭對手?
這些都是競爭差異化的來源。每一項都通過了解從供應商到制造和分銷到最終客戶的數據、知識和內容流來管理,包括了解接觸他們的最佳方式以及使用哪些營銷內容。
GenAI似乎可以為創建營銷內容提供很大幫助。但你們的GenAI營銷內容與其他人有何不同?更好的提示?更多創意問題?上下文信息?仍然需要有人性和創造性的元素。機器可以實現自動化,但仍然需要人類來連接。我們不能將人類的能力外包給機器。
雖然機器學習和新一代人工智能工具可以使人類的許多日常活動和死記硬背的活動自動化,但仍然需要填寫訂單和在目錄中組織產品。用戶需要搜索感興趣的產品。他們需要了解、選擇、購買、使用和維護您組織的產品或解決方案。
這些功能中的每一個都需要一個數據存儲庫,而數據需要一定的結構。企業中數據的核心結構被稱為主數據。主數據有多種類型——客戶產品、財務、交易和內容。市場上有許多不同的工具來解決該領域的特定用例。
主數據忽略了細微差別
但僅靠主數據就忽略了數據的許多細微差別和價值。通過了解一條信息如何與另一條信息相關,可以得出并應用真正的見解。客戶身份圖是一種數據表示形式,它說明了各種屬性(例如客戶類型、興趣、過去的購買情況、購買意圖等)之間的關系。客戶身份圖可以幫助電子商務應用向該客戶展示最相關的產品。這來自于整個客戶旅程中每個接觸點的數據耗盡時捕獲的客戶詳細信息。
接觸點留下數據痕跡
每個客戶接觸點都由各種客戶體驗技術支持,并且每個接觸點都在數據模型中捕獲客戶詳細信息-客戶描述符:人口統計、企業結構、市場細分、技術素養、購買的產品以及更多詳細信息。這些描述符在機器學習中被稱為特征,它們也可以被稱為“屬性”,描述潛在客戶或客戶特征的元數據。他們是誰?我們對他們了解多少?他們為什么規模的組織工作?他們的角色或地位是什么?他們的興趣是什么?他們的技術熟練程度如何?他們試圖實現什么目標?他們對企業的總體職責是什么?
使用RAG減少幻覺
RAG顯著擴展了大型語言模型(LLM)在企業環境中的范圍。通常,雖然LLM擅長文本創作,但他們無法從企業數據庫中提取具體、詳細的數據。RAG通過檢索必要的信息來解決這個問題,以確保人工智能生成的響應既相關又準確。
信息預處理類似于現實世界圖書館中的編目。這包括將信息組織成類別并向每條信息分配關鍵字以便于檢索和識別。這個過程有助于使數據更容易訪問、更容易搜索和理解。
構建參考庫
將組織好的數據存儲在矢量數據庫或合適的位置,為無縫集成到文本生成過程中奠定基礎。它涉及根據相關關鍵字或術語創建層次結構,然后可以使用該結構快速輕松地定位相關文檔或文本。這可以比作在圖書館根據相關主題或類型將書籍上架的過程,這可以幫助顧客快速找到他們需要的資料。
編目系統以客戶身份圖為基礎(以及其他圖數據結構)。讓LLM能夠為客戶或員工獲得正確的答案意味著根據他們的背景檢索信息。這種背景來自他們在旅途中拋出的數字肢體語言。LLM是令人驚嘆的算法。但他們需要企業數據來提供真正的效用和競爭優勢。這需要對這些數據、內容和客戶目錄進行建模,以便LLM可以檢索正確的信息,而不是將其留給自己的、可能產生幻覺的設備。獲得這些問題的答案取決于是否有適當策劃和結構化的企業信息。