出品 | 51CTO技術棧(微信號:blog51cto)
如何理解AI代理,它們如何工作?
想象一下開發一個生成式AI時代的API。這個API將支持自然語言輸入,利用大型語言模型的智能,通過與SaaS和企業系統的集成來自動化決策,并通過連接到其他生成式AI支持的API來實現業務流程編排。
上面就是一種不錯的理解方式。
它們將RAG支持的LLM的推理能力與對上下文業務知識的訪問,以及半獨立行動的能力相結合。與LLM接受自然語言輸入并回答問題不同,AI代理更像是一個真正能完成工作的商業伙伴。
更高級一點,復雜的自主代理被設計為在很大程度上無需人類互動即可工作。由于具有自主性,它們在解釋輸入和采取行動時會面臨更多風險。
由于其廣泛的用例以及超出生成式AI的智能信息處理的適用性,人工智能代理引起了商業界的極大興趣。許多人工智能代理的用例并非遙不可及,而是很可能會給出極大的獲益。
“AI代理已經從基于規則的系統發展成為能夠進行自然語言交互的智能的、由生成式人工智能驅動的工具。”
TEKsystems的首席技術官Ram Palaniappan表示,“它們可以被部署在多種不同的用例中,比如在采購中評估供應商和下達訂單、在客戶支持中進行復雜的故障排除,以及在醫療保健中提供診斷總結。那些擁有流程驅動、人力密集型運營的組織將從可擴展性、24×7的可用性和精簡的工作流程中受益。”
1.人工智能代理與API的區別
讓我們先從了解AI代理與API和其他網絡服務的區別開始。
AI代理接受自然語言和其他非技術性輸入,包括那些將接受語音、圖像和視頻的新興人工智能代理。相比之下,API只接受像JSON和XML這樣的系統導向的輸入。
AI代理不是通過編碼的業務規則,而是通過連接到RAG、語言模型和其他生成式人工智能模型來獲取相關知識。
AI代理可以根據它們被分配的角色以及它們被定義的不被允許做的事情的界限來推理下一步的行動方案。由于API是基于規則驅動的,因此它們需要更多的時間和編程工作來模擬不同的角色、決策和行動。
API和人工智能代理都可以執行事務并與其他服務進行通信。人工智能代理還可以根據它們的決策采取行動,并向其他人工智能代理發送自然語言提示。
人工智能代理向人類合作者提供自然語言輸出。非技術人員可以驗證人工智能代理的理解程度及其行動,因為決策步驟以及與API和其他人工智能代理的連接都以自然語言進行了總結。
“為像客戶服務這樣的用例構建人工智能代理的開發者應該使用自然語言而不是代碼來編碼業務邏輯。”Forethought的聯合創始人Deon Nicholas說,“他們應該讓代理具備與API進行通信的能力,就像人類與網站進行通信一樣。這將解鎖真正的代理型人工智能,它可以采取行動并解決問題,提供真正的價值。”
你需要什么樣的人工智能代理?
根據它們如何做出決策和采取行動,人工智能代理有幾種類型。基于模型的代理用人工智能模型和支持數據取代規則,而基于目標和效用的代理會在選擇行動方案之前比較不同的場景。更復雜的人工智能學習代理使用反饋循環來改進結果,而分層代理則以團隊形式工作,以分解復雜任務。
你可以將一個API包裝上自然語言界面并稱之為人工智能代理嗎?答案是肯定的;這些是利用規則將自然語言輸入與行動聯系起來的簡單反射代理。
2.開發AI代理的先決條件是什么?
在開發人工智能代理時,你應該了解涉及平臺、數據、集成、安全性和合規性的先決條件。
“人工智能代理的成功需要一個基礎平臺來處理數據集成、有效的流程自動化和非結構化數據管理。”Tray.ai的聯合創始人兼首席執行官Rich Waldron說,“人工智能代理可以被架構為符合嚴格的數據政策和安全協議,這使得它們對于IT團隊來說是有效的,可以推動生產力的提升,同時確保合規。”
Enthought的首席運營官Mike Connell說,你需要大量的干凈的(對于某些應用來說)標記過的數據,這些數據能夠準確地代表問題領域,以便訓練和驗證模型。Connell說:“強大的數據管道對于預處理、轉換以及確保實時數據流的可用性是必不可少的,以便完善模型并使其保持與不斷變化的世界的校準。此外,你還應該考慮對特定領域的本體論或嵌入的需求,以增強代理的上下文理解和決策能力。”
關于安全性和合規性,Immuta的研究副總裁Joseph Regensburger說,人工智能代理擁有身份,因此對復雜的AI鏈和知識圖譜的訪問需要像對人類一樣進行控制。Regensburger建議:“在訪問控制解決方案中捕捉法規和商業協議的頻繁變化,并在所有潛在的人類和機器行動者上執行它們。”跟上不斷變化的商業規則是至關重要的,以確保人工智能代理不是基于過時的使用協議開發的。
3.開發人工智能代理的技術和平臺
像Appian、Atlassian、Cisco Webex、Cloudera、Pega、Salesforce、SAP、ServiceNow和Workday這樣的企業平臺已經宣布在其工作流程和用戶體驗中嵌入了AI代理功能。例如,Workday招聘代理幫助人力資源招聘人員尋找和雇傭人才,而Atlassian的AI驅動的虛擬服務代理幫助自動化一級支持問題。
一些平臺還具備讓主題專家和非技術商業用戶開發自己的AI代理的能力。Salesforce的Agent Builder允許非技術用戶創建定制的人工智能代理。用戶描述代理的角色并選擇代表要完成的工作的主題,人工智能將這些映射到可以在平臺上執行的活動。其他具有人工智能代理構建能力的平臺包括Cisco Webex AI Agent Studio、ServiceNow Agentic AI和Tray.ai Merlin Agent Builder。
AI代理開發的一個選擇是直接來自平臺供應商的服務,它們使用你的數據來啟用代理分析,然后提供執行事務的API。第二個選擇是來自低代碼或無代碼、自動化和數據結構平臺的通用工具,它們可以提供用于代理開發的通用工具。
“低代碼和專業代碼工具將被用來構建代理,但低代碼將占主導地位,因為業務分析師將被授權構建自己的解決方案。”Copado的傳道副總裁David Brooks說,“這將通過快速迭代解決關鍵業務需求的代理來惠及業務。專業編碼人員將使用人工智能代理來構建提供代理功能的服務和集成。”
第三個選擇是直接用代碼、人工智能代理構建器或LLM應用框架來開發代理。
Aisera的首席執行官Abhi Maheshwari說:“你可以用Python或C++等語言原生地構建人工智能代理,或者使用像AutoGen、LangGraph或CrewAI這樣的框架,但這些框架可能無法很好地擴展,或者沒有足夠的防護措施。”
你還需要現代化的數據基礎設施,比如數據湖或湖倉。數據也必須與領域相關,并且“通過像對LLM進行微調或RAG這樣的技術無縫集成。”
希望成為開發人工智能代理的早期采用者的組織可能需要審查他們的數據管理平臺、開發工具和更智能的DevOps流程,以便能夠大規模地開發和部署代理。
“為了加速代理開發,公司需要一套強大的工具,使他們能夠設計、定制、部署和大規模監控代理。”
IBM的watsonx.ai的產品管理總監Maryam Ashoori說,“這包括針對函數調用優化的模型、用于協調代理并將它們與更廣泛的企業工具集連接起來的中間件、優化的運行時、技術防護措施以及治理能力,以確保它們按預期運行。它還將需要能夠滿足廣泛用戶和技能集的工具,從開發者的專業代碼工具到商業用戶的低代碼和無代碼工具,以便將它們嵌入到日常工作中。”
4.測試AI代理
測試LLM并驗證其準確性需要人類測試者、自動化和合成數據來進行基本的準確性測試,而更復雜的技術則利用二級人工智能模型并使用生成對抗網絡(GAN)來進行大規模測試。
Couchbase的AI、數據和分析副總裁兼戰略副總裁Rahul Pradhan說:“通過復雜的可觀測性工具、反饋循環和回退機制進行準確性測試,將幫助組織建立對人工智能代理的信任,這標志著向利用能夠自主執行任務的代理邁出了重要一步。”
AnswerRocket的首席技術官兼聯合創始人Mike Finley說,人工智能代理可以通過兩個階段進行準確性測試:
要求人工智能代理提供有據可查的證據點,其中使用的任何事實或引用都包含其來源,做出的任何決策都包含描述其輸入的有記錄的邏輯步驟。
人工智能驗證器是監督代理,其工作是監督其他人工智能代理的工作,并在審查準確性的同時尋找微妙的線索,如語氣的轉變。
5.AI代理將重新定義生產力
繼LLM和RAG之后,AI代理如何影響廣泛業務工作流程中的生產力的潛力。隨著越來越多的平臺提供代理并使開發平臺可擴展,可能會出現新的人類和人工智能責任。
“代理型人工智能將重塑工作場所,并創造新的角色,比如‘代理經理’,他們將監督專業代理,戰略性地指導這些系統,并確保它們與業務角色保持一致,就像今天的主管管理團隊一樣。”
Augury的戰略副總裁Artem Kroupenev說,“隨著多代理系統的增長,類似人力資源的部門可能會出現,以管理人類和人工智能代理的混合勞動力,專注于培訓、協調和績效指標。這種混合方法可能會將人類直覺與機器效率結合起來,以實現更好的生產力。”
增長的關鍵可能不在于開發人工智能代理有多容易,而在于組織是否會信任它們,以及員工是否會接受它們的能力。
參考鏈接:https://www.infoworld.com/article/3812583/what-you-need-to-know-about-developing-ai-agents.html