AI Agent落地面臨的三大挑戰
前面為大家介紹過AI Agent的發展史和工程結構模型,并對Agent的典型代表——Manus的技術架構進行了詳細解析。不少同學看完后紛紛留言說,他們在工作中也嘗試在推動落地Agent,但結果總是不盡如意,希望我能給出一些建議。
我自己目前對AI Agent也處在探索實踐階段,并無法給出很好的建議。不過在實踐的過程中,我總結了三點落地AI Agent要面臨的挑戰,倒是可以分享給大家。
首先還是明確一下AI Agent的基本概念:
AI Agent是具備感知環境、做出決策并執行任務能力的AI工具,通過感知、決策和行動實現目標。它的核心特點包括:
- 感知能力:獲取外部環境信息,如視覺、聽覺。
- 決策能力:基于信息推理規劃,選擇行動策略。
- 行動能力:執行具體的任務或操作,影響環境。
- 學習能力:通過與環境的交互,不斷改進策略。
簡單理解:Agent=大模型+插件+工作流,分別對應控制端、感知端和執行端。
基于AI Agent的定義和特點,下面是我總結的三點落地AI Agent要面臨的挑戰:
一、用戶業務場景
在工作場景中落地AI Agent工具或者產品,我個人認為,面臨的最大挑戰是發現真的對用戶有價值的Workflow。如何理解這句話呢?
假設你是一名測試工程師,日常工作中絕大多數時間都圍繞著需求和測試用例開展,如果你想通過AI Agent來解決你測試過程中遇到的問題,比如測試用例編寫、生成測試數據、自動化測試腳本,那Agent一定要能在這些環節帶來效率和準確率的提升,否則你會發現投入產出差距太大。
很多同學對Agent期望太高,想通過一個Agent來完成一個復雜的功能,但截至目前能看到的一個現象就是,單獨的Agent完成一項測試任務的投入產出比,其實還不如已經建設完成的CICD流水線,甚至是已有的自動化測試任務。
如果已有的自動化流程可以完成80%的任務,那AI Agent的優勢就完全不突出,你也很難說服老板,投入大量資源在AI落地方面。
一句話概括:找到真實存在痛點的場景,然后再考慮用Agent+Workflow來解決。
二、用戶使用習慣
回看過去二十年,無論是PC互聯網時代還是移動互聯網時代,你會發現,每當出現一個全新的技術或者產品時,無論是專業的產品經理、研發工程師還是普通用戶,都不一定清楚如何快速有效地使用它。
在當前的AI領域,這個現象依然存在。很多用戶仍然在用原來的互聯網思維,或者三年前使用ChatGPT的思維來使用Agent,在這種思維下很快你就會發現Agent存在的種種不足,主要原因有如下幾點:
- AI技術落地的基礎技術設施建設缺乏。
- 大多數工程師當前仍處于學習探索階段,落地能力仍顯不足。
- 業內缺乏行之有效的最佳實踐案例和方法論,即使大廠也僅僅是飽和式探索。
在上述這三個因素的基礎上,將AI的落地和使用經驗傳遞給普通用戶,讓他們快速上手,本身就是一個很難的挑戰。
當前在多數公司中,真正研究和落地AI的仍是少數人,如果對AI的認知和經驗無法快速推廣,則短期內很難看到AI帶來的效率。
三、Agent的效率和精度
大模型的本質是是一個概率預測機器,它會根據用戶輸入來預測生成token,并依據已經生成的token生成下一個token。作為AI Agent的底層基礎技術設施(操作系統),就會導致這樣一個現象:
AI Agent需要通過多次調用模型和推理鏈路來保證最終輸出結果的準確性,因此任務執行時間較長。而對大多數使用AI的人來說,過長的等待時間會耗盡本就不多的對AI的期待和興趣。
從個人角度來看,AI Agent要想真正的帶來超過傳統IT技術的價值,真正的挑戰在于產品設計、實用性以及用戶(這里的用戶包括普通用戶和工作中使用AI Agent的人)接受度方面。
長期來說,技術問題遲早會被解決,效率和信息幻覺問題也會在很大程度上被緩解和提升,但AI產品設計和用戶適應的問題,可能會長期存在。
換言之,未來AI會進一步拉開普通人的認知和能力差距,造就全新的思考和創新荒漠。與此同時,能快速跟上并掌握如何使用AI的人,會在不遠的將來獲得難以想象的收益。