谷歌開發者大會炸場!Agent重磅升級,?A2A、SDK大更新
今天凌晨,谷歌召開了“I/O 2025”全球開發者大會,發布了很多產品包括新視頻模型、代碼模型、文本模型等,尤其是對Agent智能體進行了重磅升級。
例如,全新影視級文生視頻模型Flow,創新架構小參數模型Gemma3n,基于AI模型的全新搜索模式等。
下面「AIGC開放社區」為大家介紹谷歌在第一天開發者大會上,與Agent智能體相關的重要內容。
A2A協議大更新
與昨天微軟召開的“Build2025”全球開發者大會一樣,Agent智能體也是谷歌現階段和未來重要發展賽道之一。
A2A是谷歌在本月7號剛開源的一個專門面向智能體的交互協議,主要用于打破數據孤島,對智能體的能力、跨平臺、執行效率產生質的改變。
現在,谷歌發布了A2A協議v0.2版本,增加了眾多關鍵功能:
1)支持無狀態交互,在以往許多場景下,智能體間的會話管理較為復雜,阻礙了高效通信。如今有了這一功能,對于那些無需會話管理的場景,開發過程得到極大簡化。
例如,在一些簡單的信息查詢類任務中,一個智能體只需向另一個智能體獲取特定數據,以往可能要經歷繁瑣的會話建立、維持與結束流程。
現在無狀態交互讓這一過程變得直接而高效,智能體之間可以快速地交換信息,實現了更輕量化的通信,提升了自動化任務的執行效率。
2)引入“智能體卡”概念,這是一種由A2A服務器發布的JSON元數據文檔,用于描述其身份、能力、技能、服務端點和認證要求。消息、任務、部分、工件、流式傳輸、推送通知和會話等概念也在協議中得到了定義,以支持復雜的交互模式。
例如,智能體卡現在可以明確指出智能體是否支持流式傳輸和推送通知,這使得客戶端能夠更清楚地了解智能體的能力,從而更高效地進行交互。
3)文件交換優化,在文件交換方面,0.2.0版本引入了更靈活的處理方式。智能體不僅可以直接返回文件的字節內容,還可以提供一個URI,指向存儲文件的臨時位置。這使得智能體能夠更高效地處理大文件,同時也減少了數據傳輸的開銷。
4)標準化身份驗證,基于類似OpenAPI的身份驗證模式,正式確定了身份驗證方案,確保了智能體間身份驗證要求的清晰傳達,增強了智能體間交互的安全性和可靠性。
在多智能體協作的復雜網絡里,不同智能體來自不同的開發團隊與平臺,過去身份驗證方式各不相同,導致智能體之間通信時,安全風險增加且溝通成本變高。
現在,新的標準化身份驗證方案使得各個智能體在交互前,能清晰知曉對方的身份驗證要求,無論是使用API密鑰、OAuth還是OIDC等方式,都有了明確規范。
例如,一家企業內部有多個不同部門開發的智能體,財務部門的智能體在與銷售部門的智能體協作處理訂單財務相關任務時,雙方依據新的標準化身份驗證方案,能快速、安全地完成身份驗證流程,保障了數據傳輸與協作的安全性,極大地增強了智能體間交互的可靠性。
此外,為了讓開發者更輕松地利用A2A協議,谷歌發布了官方的A2A Python SDK。這個專用的SDK提供了使用A2A進行交互和構建所需的工具,簡化了將這些強大的通信功能集成到基于Python的智能體中的過程。
A2A生態持續擴大
雖然A2A開源時間很短,但已經有微軟、埃森哲、波士頓咨詢集團、凱捷、科睿唯安、Salesforce、德勤、甲骨文、HCL科技、印孚瑟斯、KPMG、SAP、麥肯錫、普華永道等50多家全球著名企業加入。
例如,微軟宣布在AzureAI Foundry中支持該協議,以構建A2A智能體,并能夠在Microsoft CopilotStudio中調用任何A2A智能體。微軟還展示了如何通過使用Microsoft EntraAgentID和Microsoft Graph調用多個A2A智能體,將A2A用于工作場所生產力場景。
SAP正在其AI助手Joule中添加對A2A協議的支持,這將使Joule能夠在SAP生態系統內協調智能體,并在Joule用戶界面中調用如使用谷歌ADK構建的A2A智能體,這樣用戶就可以訪問多個系統的智能體來完成更多任務,而無需切換上下文。
BoxAI智能體通過提取日期和合同條款等關鍵細節,將掃描件和圖像等非結構化內容轉化為可操作的數據。通過采用A2A協議,BoxAI智能體可以與外部智能體安全協作,直接在內容所在的位置完成復雜的多系統流程。
Agent Engine UI
為了幫助開發者更好的在生產環境中部署、管理和擴展智能體。谷歌發布了Agent Engine UI引擎界面,以更直接、集中的方式簡化智能體生命周期管理。
UI引擎可在谷歌云控制臺中訪問,提供了一個全面的儀表板,用于查看和管理已部署的智能體、列出會話、跟蹤和調試操作以及監控智能體。
這種簡化的方法顯著增強了開發和管理流程,讓開發者能夠更好地控制智能體,并深入了解其行為和性能。在智能體引擎用戶界面中,開發者可以檢查已部署的智能體、查看指標,例如,請求和CPU使用率、會話、檢查部署細節,并深入了解跟蹤情況。
Agent SDK升級
谷歌對開源的Agent SDK進行了升級,發布了Python ADKv1.0.0版本,為開發者提供了一個可靠且強大的平臺,能夠在更復雜的環境中快速開發和部署智能體。
為了擴大覆蓋范圍,谷歌還推出了Java ADK v0.1.0的初始版本,將ADK的強大功能和靈活性帶給Java開發者,使他們能夠在智能體開發需求中利用其能力。若要開始使用Java ADK,開發者可在Maven項目中添加相應依賴。
多任務智能體Project Mariner
自去年谷歌公布預覽版Project Mariner智能體以來,就一直不斷探索其應用場景,涵蓋信息查找、預訂服務、購物下單、開展研究等多個方面。在搜索信息時,能快速篩選整合內容;
預訂酒店、機票時,自動匹配符合用戶需求的選項;購物時精準定位商品;做研究時,高效檢索并梳理資料,極大地節省了用戶時間和精力。
現在谷歌進一步增強了Project Mariner的能力,不僅能夠獨立完成任務,還能相互協作。例如,一個智能體可以負責查找信息,另一個智能體可以負責預訂,而第三個智能體可以負責支付。這種協作機制使得復雜的任務能夠被分解為多個子任務,并由不同的智能體并行處理,從而顯著提高了整體效率。
為了確保用戶能夠輕松地與智能體進行交互,Project Mariner提供了一個直觀的用戶界面。用戶可以通過簡單的語音命令或文本輸入來請求智能體執行任務,而智能體則能夠以自然語言的形式提供反饋和結果。這種友好的用戶界面設計使得Project Mariner更易于使用,即使是沒有技術背景的用戶也能夠輕松上手。
Project Mariner還包含了一些實驗性功能。例如,能夠通過屏幕共享和視頻理解功能,幫助用戶更好地理解和處理復雜的任務。這些實驗性功能為未來的人工智能助手提供了新的可能性。
此外,Project Mariner的功能不僅限于瀏覽器,谷歌還計劃將其擴展到更多平臺,包括移動設備和智能眼鏡等。幫助用戶可以在不同的設備上無縫切換,享受一致的智能體服務體驗。