“谷歌版MCP”來了!開源A2A,不同廠商Agent也能協作
剛剛,“谷歌版MCP”來了!
谷歌推出A2A協議,即Agent2Agent,能讓AI Agent在不同生態系統間安全協作,而無需考慮框架或供應商。
不同平臺構建的AI Agent之間可以進行通信、發現彼此的能力、協商任務并開展協作,企業可通過專業Agent團隊處理復雜工作流。
重點:開源的。
圖片
話不多說,先來看一個展示。
借助A2A協議,招聘這件事兒還能這么玩:
在谷歌Agentspace統一界面中,招聘經理可以向自己的Agent下達任務,讓其尋找與職位描述、工作地點和技能要求相匹配的候選人。
然后,該Agent立馬與其它專業Agent展開交互,尋找潛在候選人。
用戶會收到推薦人選,之后可指示自己的Agent安排進一步的面試,面試環節結束后,還可以啟用另一個Agent來協助進行背調。
總結來說,A2A遵循五大設計原則:
1)發揮Agent的能力:專注于讓Agent以自然非結構化的模式進行協作,即使它們之間沒有共享內存/工具/上下文信息,致力于實現真正的Agent多場景,不會將某個Agent局限為一種“工具”。
2)基于現有標準構建:該協議是在包括HTTP、SSE、JSON-RPC等現有常用標準基礎上構建的,更容易與企業日常使用的現有信息技術堆棧相集成。
3)默認安全:支持企業級身份驗證和授權,在推出時其安全性符合OpenAPI級別的認證標準。
4)持長時間運行的任務:各種場景A2A都能應對,包括從快速完成的任務,到那些可能需數小時甚至數天才能完成的深入研究任務。整個過程中,A2A可為用戶提供實時反饋、通知以及狀態更新。
5)模態無關:支持包括音頻、視頻等在內的各種模態。
據了解,A2A已經得到了包括Atlassian、Box、Cohere、Intuit、Langchain、埃森哲、BCG、Capgemini、Cognizant等在內的50多家技術合作伙伴和服務提供商的支持。
圖片
擁有四大能力
一張圖來看A2A如何工作。
圖片
“客戶端”Agent與“遠程”Agent之間進行通信,客戶端Agent負責制定和傳達任務,遠程Agent則負責執行這些任務,或是提供正確信息,或是采取正確行動。
這種交互涉及到幾個關鍵能力。
首先是能力發現,Agent可以使用JSON格式的“Agent Card”來展示自身的能力。因此,客戶端Agent能夠識別出最適合執行某項任務的Agent,利用A2A協議與遠程Agent進行通信。
其次是任務管理,客戶端Agent與遠程Agent之間的通信以任務完成為導向,Agent協同工作滿足終端用戶的請求。
此“任務”對象由協議定義,并且具有一個生命周期。它可以立即完成,或者對于長時間運行的任務,每個Agent可以相互通信,對任務完成的最新狀態保持同步。任務的輸出稱為“artifact(工件)”。
另外是協作,Agent之間可以相互發送消息,交流上下文信息、回復內容、artifacts或用戶指令。
最后是用戶體驗協商,每條消息都包含“部分”,這是一個完整的內容片段,如生成的圖像。每個部分都有指定的內容類型,允許客戶端Agent和遠程Agent協商所需的正確格式,并明確包括對用戶UI功能的協商,例如iframe、視頻、網頁表單等等。
除此之外,谷歌還解釋道,A2A是MCP的補充。
MCP為Agent提供了實用的工具和上下文背景信息,A2A協議解決客戶部署大規模多Agent系統時所發現的問題。
關鍵是,企業能從一種標準化的方法中受益,管理他們在各種平臺和云環境中的Agent。這種通用互操作性對于充分發揮協作型AI Agent的潛力至關重要。
A2A發布后網友們也將其與MCP進行了比較,看下面這張圖就更明了了:
MCP有助于連接各種工具和資源,A2A則有助于Agent之間進行通信。
圖片
值得一提的是,谷歌DeepMind聯合創始人兼CEO哈薩比斯還專門發了一條推文稱:
MCP是一個出色的協議,并且它正迅速成為AI Agent時代的一項開放標準。我們非常高興地宣布,我們將為自家的 Gemini模型和SDK提供對該協議的支持。期待能與MCP團隊以及行業內的其他各方進一步共同開發完善該協議。
圖片