AI殺手級應用有苗頭了,自主使用操作系統Agent智能體,開源!
最近微軟開源了一個 Agent 叫 UFO,通過自然語言指令實現 Windows 操作系統上的自動化任務操作。
圖片
之前我們分享的 Agent 大多是自主使用瀏覽器,而 UFO 更進了一步,可以使用操作系統中的各種APP幫你完成任務。
下面是 UFO 的架構圖:
UFO2 architecture
可以看到,它是一個多Agent系統,中間的 HostAgent 用來解析用戶的自然語言,啟動必要的應用程序。
下面的每個應用程序都對應一個Agent。
這讓我想到了前段時間谷歌提出的一個跟MCP類似協議——A2A,用于制定Agent之間通信的標準協議。
圖片
從 UFO 的架構上看,普通A2A這類協議還是很有必要的。
假如上述應用程序Agent都支持了A2A協議,那我們開發的Agent也就都能輕松調用Windows 系統的各種應用程序,既能加快Agent開發效率,也可以大大提高Agent的能力。
最近,我們也在開發一個跟 Manus 類似的智能體,對AI時代“殺手級”應用有一些思考。
我覺得“殺手級”應用一定要具備的一個特點就是之前完全沒出現過,一定是一個全新物種。
比如,互聯網時代,淘寶就是一個殺手級應用,是互聯網時代的全新物種。淘寶出現之前,不能甚至不敢想象,我們還可以完成跨時空購物。
反之,目前一些垂類Agent,比如旅游Agent,幫用戶自動規劃出行、游玩。
這類Agent雖然能解決一大部分人的旅游需求,但它成不了“殺手級”,因為即便沒有大模型,這類需求也能被滿足很好(旅行社),大模型無非解決的就是效率問題。
所以,從這個角度說,我覺得到目前為止,Manus、UFO這類智能體至少已經有“殺手級”的苗頭。
雖然,這些產品現階段不可避免被大家吐槽智障,但起碼是一個全新物種。一句話讓一個Agent像助理一樣自動幫你干完活,這個現象在之前是完全沒有的。
無論如何,AI時代,我們普通人最大的機會在于擁抱AI,積極擁抱變化,在AI浪潮中找到屬于自己的位置。