通過我們的指南了解如何為您的企業釋放人工智能的力量。了解 RAG 和 CRAG 集成、矢量嵌入、LLM 和提示工程。非常適合負責任地擁抱人工智能的企業。
為企業打造AI-Ready平臺
企業在引入生成式人工智能時,會遇到許多需要戰略管理的業務風險。這些風險通常是相互關聯的,范圍從導致合規問題的潛在偏見到缺乏領域知識。主要問題包括聲譽損害、遵守法律和監管標準(尤其是與客戶互動有關)、知識產權侵權、道德問題和隱私問題(尤其是在處理個人或可識別數據時)。
建議采用檢索增強生成(RAG)等混合策略來應對這些挑戰。RAG提高了人工智能生成內容的準確性和相關性,為企業人工智能計劃提供了更安全、更可靠的框架。該策略不僅解決了缺乏知識和錯誤信息等緊迫問題,而且遵守法律和道德規范,防止聲譽受損和合規違規行為。
了解檢索增強生成 (RAG)
檢索增強生成(RAG)是一種先進方法,通過集成企業知識庫中的信息來提高人工智能內容創建的準確性和可靠性。將 RAG 視為一位大廚,他依靠與生俱來的天賦、全面的培訓和創意天賦,所有這些都得到了對烹飪基礎知識的透徹理解的支持。當需要使用不尋常的香料或滿足對新穎菜肴的要求時,廚師會查閱可靠的烹飪參考資料,以確保成分得到最佳利用。
正如大廚可以烹制出各種菜肴一樣,GPT和 LLaMA-2 等人工智能系統也可以創建各種主題的內容。然而,當他們需要提供具體和準確的細節時,特別是在新奇美食等復雜主題或瀏覽大量企業數據時,他們會使用特殊的工具來實現精度和深度。

如果 RAG 的檢索階段不充分怎么辦?

Corrective-RAG(CRAG)介入以增強 RAG 設置的穩健性。CRAG 使用 T5 來評估檢索到的文檔的相關性。如果來自企業來源的文檔被認為不相關,則可能會默認通過網絡搜索來填補空白。
企業級生成人工智能解決方案的架構注意事項
架構從根本上是圍繞三個核心支柱構建的:數據攝入、查詢和智能檢索、生成提示工程和大語言模型。
數據攝入:第一步是將公司文檔的內容轉換為易于查詢的格式。此轉換是使用嵌入模型完成的,遵循以下操作序列
- 數據分段:來自企業知識源(例如 Confluence、Jira 和 PDF)的各種文檔被提取到系統中。此步驟涉及將文檔分解為可管理的部分,通常稱為“塊”。
- 嵌入模型:然后將這些文檔塊傳遞給嵌入模型。嵌入模型是一種神經網絡,它將文本轉換為表示文本語義的數字形式(向量),使其能夠被機器理解。
- 索引塊:然后對嵌入模型產生的向量進行索引。索引是以有利于高效檢索的方式組織數據的過程。
- 矢量數據庫:將所有矢量嵌入保存在矢量數據庫中。并將每個嵌入表示的文本保存在不同的文件中,確保包含對相應嵌入的引用。
查詢和智能檢索:推理服務器收到用戶的問題后,就會通過嵌入過程將其轉換為向量,該過程使用相同的模型在知識庫中嵌入文檔。然后,向量數據庫進行搜索,以識別與用戶意圖密切相關的向量,并將其提供給大型語言模型 (LLM) 以豐富上下文。
5.查詢:從應用程序和API層進行查詢。該查詢是用戶或其他應用程序在搜索信息時輸入的內容。
6.嵌入查詢檢索:利用生成的 Vector.Embedding 在矢量數據庫的索引中開始搜索。選擇您想要從矢量數據庫中檢索的矢量數量;這個數字將與您計劃編譯和用于解決問題的上下文數量成正比。
7.向量(相似向量):該過程識別相似向量,這些向量表示與查詢上下文相關的文檔塊。
8.檢索相關向量:
從向量數據庫中檢索相關向量。例如,在廚師的背景下,它可能相當于兩個相關向量:食譜和準備步驟。相應的片段將被收集并隨提示一起提供。
9.檢索相關塊:系統獲取與被識別為與查詢相關的向量相匹配的文檔部分。一旦評估了信息的相關性,系統就會確定后續步驟。如果信息完全一致,它會根據重要性進行排列。如果信息不正確,系統會將其丟棄并在線查找更好的信息。
生成提示工程和LLMs:生成提示工程對于指導大型語言模型給出正確答案至關重要。它涉及創建考慮到任何數據差距的清晰而精確的問題。這個過程是持續進行的,需要定期調整以獲得更好的響應。確保這些問題合乎道德、沒有偏見并避免敏感話題也很重要。
10. 提示工程:然后將檢索到的塊與原始查詢一起使用以創建提示。該提示旨在有效地將查詢上下文傳達給語言模型。
11. LLM(大型語言模型):工程提示由大型語言模型處理。這些模型可以根據收到的輸入生成類似人類的文本。
12. 答案:最后,語言模型使用提示提供的上下文和檢索到的塊來生成查詢的答案。然后,該答案通過應用程序和 API 層發送回用戶。
結論
本博客探討了將人工智能集成到軟件開發中的復雜過程,強調了受 CRAG 啟發建立企業生成人工智能平臺的變革潛力。通過解決即時工程、數據管理和創新檢索增強生成 (RAG) 方法的復雜性,我們概述了將人工智能技術納入業務運營核心的方法。未來的討論將進一步深入探討智能開發的生成式人工智能框架,研究最大限度地利用人工智能的具體工具、技術和策略,確保更智能、更高效的開發環境。
作者 | Venkat Rangasamy