MCP失寵?谷歌重磅開(kāi)源A2A協(xié)議 實(shí)現(xiàn)智能體間的自由“對(duì)話” 原創(chuàng)
谷歌云正式宣布推出全新的開(kāi)源協(xié)議Agent2Agent(A2A),旨在打破當(dāng)前人工智能(AI)智能體之間的壁壘,實(shí)現(xiàn)不同廠商、不同框架構(gòu)建的AI智能體之間的無(wú)縫協(xié)作與信息交換。這一舉措標(biāo)志著AI領(lǐng)域邁向更加開(kāi)放、高效和智能的新時(shí)代。
打破壁壘,實(shí)現(xiàn)智能體間的自由“對(duì)話”
隨著企業(yè)對(duì)自主AI智能體的部署日益增長(zhǎng),如何讓這些智能體在復(fù)雜的企業(yè)環(huán)境中協(xié)同工作,處理跨系統(tǒng)、跨應(yīng)用的日常或復(fù)雜任務(wù),成為了提升生產(chǎn)力的關(guān)鍵。然而,由于缺乏統(tǒng)一的標(biāo)準(zhǔn),不同智能體之間往往難以有效溝通和協(xié)作,形成了一個(gè)個(gè)“信息孤島”。
作為一個(gè)開(kāi)放協(xié)議,A2A為AI智能體之間的通信、安全信息交換和協(xié)同行動(dòng)提供了一套標(biāo)準(zhǔn)化的方法。無(wú)論這些智能體是由哪家供應(yīng)商開(kāi)發(fā),采用何種底層技術(shù),只要遵循A2A協(xié)議,就能實(shí)現(xiàn)真正的多智能體場(chǎng)景,擺脫了傳統(tǒng)上將智能體局限于單一“工具”的限制。
MCP(模型上下文協(xié)議)用于工具和資源連接:通過(guò)結(jié)構(gòu)化輸入/輸出來(lái)連接代理與工具、API 和資源。MCP重點(diǎn)在于傳輸?shù)臄?shù)據(jù)類(lèi)型和傳輸協(xié)議的優(yōu)化,去除function call的生態(tài)隔離;
A2A(代理間通信協(xié)議)用于代理協(xié)作:支持不同代理間的動(dòng)態(tài)、多模態(tài)通信,無(wú)需共享記憶、資源或工具。A2A是model-level server級(jí)別的交流,重點(diǎn)在于multi-agent融合的算子結(jié)構(gòu),通過(guò)workflow或者鏈?zhǔn)交M合,以rules驅(qū)動(dòng)multi-agent進(jìn)行算子化。
Agent2Agent(A2A)旨在讓AI代理之間能夠通信、共享信息,并在多種企業(yè)平臺(tái)中協(xié)同操作。A2A補(bǔ)充了Anthropic的模型上下文協(xié)議(MCP),參考了Google在構(gòu)建大規(guī)模代理系統(tǒng)中的經(jīng)驗(yàn),專為解決企業(yè)部署多代理系統(tǒng)面臨的挑戰(zhàn)而設(shè)計(jì)。它使開(kāi)發(fā)者能創(chuàng)建可與任何支持A2A的代理互聯(lián)的系統(tǒng),并為企業(yè)帶來(lái)標(biāo)準(zhǔn)化的代理管理方法,助力實(shí)現(xiàn)協(xié)作AI的巨大潛力。
按Google的說(shuō)法,A2A協(xié)議與MCP是互補(bǔ)而不替代關(guān)系,A2A負(fù)責(zé)解決Agent間的通信問(wèn)題,MCP解決的是Agent與工具間的通信問(wèn)題。
五大核心設(shè)計(jì)原則,打造強(qiáng)大可靠的互操作性基礎(chǔ)
A2A協(xié)議在設(shè)計(jì)之初就秉持了五大關(guān)鍵原則,以確保其能夠適應(yīng)未來(lái)復(fù)雜多變的AI應(yīng)用場(chǎng)景:
- 擁抱智能體能力 (Embrace agentic capabilities):A2A側(cè)重于使智能體能夠以其自然的、非結(jié)構(gòu)化的方式進(jìn)行協(xié)作,即使它們不共享內(nèi)存、工具和上下文也能高效工作。
- 構(gòu)建于現(xiàn)有標(biāo)準(zhǔn)之上 (Build on existing standards):該協(xié)議基于HTTP、SSE和JSON-RPC等流行的現(xiàn)有標(biāo)準(zhǔn)構(gòu)建,這大大降低了企業(yè)將其集成到現(xiàn)有IT架構(gòu)中的難度。
- 默認(rèn)安全 (Secure by default):A2A在設(shè)計(jì)上就支持企業(yè)級(jí)的身份驗(yàn)證和授權(quán),其安全性與OpenAPI的身份驗(yàn)證方案相當(dāng)。
- 支持長(zhǎng)期任務(wù) (Support for long-running tasks):A2A具有高度的靈活性,可以支持從快速任務(wù)到需要數(shù)小時(shí)甚至數(shù)天才能完成的深度研究等各種場(chǎng)景。在整個(gè)過(guò)程中,A2A可以向用戶提供實(shí)時(shí)的反饋、通知和狀態(tài)更新。
- 模態(tài)無(wú)關(guān) (Modality agnostic):考慮到智能世界不僅限于文本,A2A還支持包括音頻和視頻流在內(nèi)的多種模態(tài)。
A2A工作原理
A2A的工作原理是通過(guò)促進(jìn)客戶端Agent和遠(yuǎn)程Agent之間的通信來(lái)實(shí)現(xiàn)的。客戶端Agent負(fù)責(zé)制定和傳達(dá)任務(wù),而遠(yuǎn)程Agent則根據(jù)這些任務(wù)采取行動(dòng),以提供正確的信息或執(zhí)行相應(yīng)的操作。在這個(gè)過(guò)程中,A2A協(xié)議有以下幾個(gè)關(guān)鍵能力。
首先,Agent可以通過(guò)“Agent卡”來(lái)宣傳它們的能力。這些“Agent卡”是以JSON格式存在的,它們能夠讓客戶端Agent識(shí)別出哪個(gè)遠(yuǎn)程Agent最適合執(zhí)行特定的任務(wù)。一旦確定了合適的遠(yuǎn)程Agent,客戶端Agent就可以利用A2A協(xié)議與之進(jìn)行通信,將任務(wù)分配給它。
然后,任務(wù)管理是A2A協(xié)議中的一個(gè)重要環(huán)節(jié)。客戶端和遠(yuǎn)程Agent之間的通信都是圍繞完成任務(wù)展開(kāi)的。協(xié)議定義了一個(gè)“任務(wù)”對(duì)象,這個(gè)對(duì)象具有自己的生命周期。
對(duì)于一些簡(jiǎn)單的任務(wù),可能可以立即完成;而對(duì)于一些復(fù)雜的、長(zhǎng)期的任務(wù),Agent們可以相互溝通,以保持對(duì)任務(wù)完成狀態(tài)的同步。當(dāng)任務(wù)完成時(shí),其輸出被稱為“工件”。
最后,A2A還具備用戶體驗(yàn)協(xié)商的功能。每條消息都包含“部分”,這些部分是完整的內(nèi)容片段,例如,生成的圖像。
每個(gè)部分都有指定的內(nèi)容類(lèi)型,這使得客戶端和遠(yuǎn)程Agent能夠協(xié)商所需的正確格式,并且明確包括用戶界面能力的協(xié)商,比如iframe、視頻、網(wǎng)絡(luò)表單等。這樣,A2A就能夠根據(jù)用戶的需求和設(shè)備的能力,提供最佳的用戶體驗(yàn)。
A2A實(shí)現(xiàn)客戶端代理與遠(yuǎn)程代理之間的任務(wù)通信:前者負(fù)責(zé)發(fā)起任務(wù),后者負(fù)責(zé)執(zhí)行任務(wù)。核心能力包括:
- 能力發(fā)現(xiàn):通過(guò) JSON 格式的“代理卡片”公開(kāi)功能,便于選擇合適的代理協(xié)作。
- 任務(wù)管理:圍繞任務(wù)對(duì)象協(xié)作,支持即時(shí)或長(zhǎng)時(shí)間運(yùn)行任務(wù),輸出結(jié)果稱為“工件”。
- 協(xié)作通信:代理可交換上下文、回復(fù)、工件及用戶指令等信息。
- 體驗(yàn)協(xié)商:消息由多個(gè)“部分”組成,支持多種內(nèi)容類(lèi)型,便于適配用戶界面能。
A2A 的本質(zhì):
1??將 MCP 的核心原則(能力描述而非顯式指令)應(yīng)用和擴(kuò)展到了 AI 智能體 (Agent) 之間的交互。
2??關(guān)注點(diǎn): 不僅僅是智能體如何使用“工具”,更是智能體之間如何相互發(fā)現(xiàn) (discovering each other)、理解彼此的能力,并自主協(xié)商如何協(xié)作 (how they collaborate)。
A2A的挑戰(zhàn):
1??狀態(tài)管理 : 在多智能體系統(tǒng)中保持狀態(tài)一致性、處理沖突和部分失敗很復(fù)雜。
2??推理成本 : 智能體每次協(xié)商交互都需要消耗計(jì)算資源、Token 和時(shí)間,在多智能體系統(tǒng)中成本會(huì)累積,需要高效的優(yōu)化策略。
3??安全性 : 智能體間交互引入了新的漏洞層面,需要強(qiáng)大的認(rèn)證、授權(quán)、審計(jì)追蹤等機(jī)制,且不能破壞系統(tǒng)的靈活性。
4??構(gòu)建難度: 目前用 MCP 和 A2A 構(gòu)建規(guī)模化、可靠的系統(tǒng)仍具挑戰(zhàn)。
通過(guò) A2A 協(xié)作,招聘軟件工程師的流程可大大簡(jiǎn)化。在像 Agentspace 這樣統(tǒng)一的界面中,用戶(如招聘經(jīng)理)可以指派自己的代理,根據(jù)職位描述、地點(diǎn)和技能要求尋找候選人。該代理會(huì)與其他專業(yè)代理協(xié)作,獲取合適人選。用戶收到推薦后,可進(jìn)一步指示代理安排面試,從而簡(jiǎn)化人才篩選流程。面試結(jié)束后,還可調(diào)用其他代理完成背景調(diào)查。這只是 AI 代理跨系統(tǒng)協(xié)作以招聘合格候選人的一個(gè)典型例子。
https://github.com/google/A2A
A2A協(xié)議的發(fā)布得到了超過(guò)50家技術(shù)合作伙伴和領(lǐng)先服務(wù)提供商的支持與貢獻(xiàn)。其中包括Atlassian、Box、Cohere、Intuit、Langchain、MongoDB、PayPal、Salesforce、SAP、ServiceNow、UKG和Workday等技術(shù)巨頭,以及Accenture、BCG、Capgemini、Deloitte、KPMG和PwC等知名咨詢公司。眾多合作伙伴紛紛表示,A2A協(xié)議將有助于推動(dòng)AI在企業(yè)中的更廣泛應(yīng)用,實(shí)現(xiàn)更高效、更智能的工作流程。
本文轉(zhuǎn)載自公眾號(hào)數(shù)字化助推器 作者:天涯咫尺TGH
原文鏈接:??https://mp.weixin.qq.com/s/Q4vUL7wfMDjcE_O_cf6BMQ??
