編輯|云昭
4月10凌晨,谷歌CEO皮查伊帶著一系列重磅的發布亮相拉斯維加斯Next2025,可謂從底層的TPU芯片到上層的Agent構建,都有讓人眼前一亮的新品。
1.性能提升3600倍,專為推理而生的TPU
正式發布谷歌第七代 TPU Ironwood,它專為推理而設計。皮查伊介紹道,相較于第一代云 TPU ,Ironwood 性能提升了 3600 倍,效率提升了 29 倍。Ironwood 將于今年晚些時候上市。
圖片
谷歌作為唯一一家擁有超過十年經驗的超級計算公司,將很多尖端科技的研究都用于Ironwood的能力提升上中,主要特點包括:
- 在顯著提升性能的同時,還注重能效,使AI工作負載能夠更經濟地運行。Ironwood的性能/瓦特比是我們去年宣布的第六代TPU——Trillium的兩倍,為每個瓦特提供更多的容量。其先進的液體冷卻解決方案和優化的芯片設計可以x做到可靠地保持標準空氣冷卻的兩倍性能。實際上,Ironwood比谷歌2018年的第一代TPU節能近30倍。
- 高帶寬內存(HBM)容量大幅增加。Ironwood每個芯片提供192 GB,是Trillium的6倍,這使得處理更大的模型和數據集成為可能,減少了頻繁數據傳輸的需求并提高了性能。
- 顯著提高的HBM帶寬,每個芯片達到7.2 TBps,是Trillium的4.5倍。這種高帶寬確保了快速的數據訪問,這對于現代AI中常見的內存密集型工作負載至關重要。
- 增強的芯片間互連(ICI)帶寬。這已增加到1.2 Tbps雙向,是Trillium的1.5倍,使得芯片之間的通信更快,促進了大規模分布式訓練和推理的高效進行。
圖片
對于谷歌云客戶,Ironwood根據AI工作負載需求提供兩種尺寸:256芯片配置和9,216芯片配置。當擴展到每個機架9,216個芯片,總計42.5 Exaflops時,Ironwood支持的計算能力超過世界上最大的超級計算機——El Capitan的24倍。
Ironwood提供了大規模并行處理能力,這對于最苛刻的AI工作負載(如具有推理能力的超大尺寸密集型LLM或MoE模型)來說是必要的。每個單獨的芯片峰值計算能力達到4,614 TFLOPS。Ironwood的內存和網絡架構確保了在如此大規模下始終有足夠的數據來支持峰值性能。
此外,Ironwood還具有增強的SparseCore,這是一種專門用于處理高級排名和推薦工作負載中常見的超大型嵌入的加速器。Ironwood中擴展的SparseCore支持允許更廣泛的工作負載加速,包括超越傳統AI領域到金融和科學領域。
這還沒完,DeepMind還開發了機器學習運行時Pathways,能夠在多個TPU芯片上實現高效的分布式計算。谷歌云上的Pathways使得超越單個Ironwood機架成為可能,使成千上萬的Ironwood芯片能夠組合在一起,以快速推進生成式AI計算的前沿。
圖片
2.面向全球開放谷歌自家的私有網絡:云廣域網
緊接著,皮查伊秀出了谷歌引以為傲的全球基礎設施。眾所周知,谷歌的主干網絡在全球數一數二,以接近零延遲的速度全天候為全球數十億用戶支持像Gmail、照片和搜索這樣出色的服務,包括谷內內部也通過它來訓練其最強大的模型Gemini。
這條主干網絡覆蓋了超過200個國家和地區,由超過200萬英里的光纖提供支持。
這里就很難想象,皮查伊甩出一個爆炸性的宣布:谷歌將向全球各地的所有谷歌云客戶企業開放谷歌的全球私有網絡,并將其稱之為云廣域網(Cloud Wide Area Network,簡稱WAN)。
云廣域網利用谷歌的行星規模網絡。它針對應用程序性能進行了優化,并提供超過40%的性能提升,同時將總擁有成本降低高達40%。像雀巢和花旗證券這樣的公司已經在使用這個網絡來獲得更快、更可靠的解決方案。這次可以說不管大小客戶,都可以使用谷歌自家的私有網絡了。
3.黃仁勛站臺谷歌:巨頭聯合搞事情
本次大會的另一個重磅亮點就是,谷歌與英偉達這兩大超級巨頭聯手打造的谷歌分布式云。
圖片
此前,我們就曾報道過谷歌云也使用英偉達的GPU的消息。而今天老黃直接親自站臺的宣傳,則是更加表明:通過谷歌分布式云平臺,受到地緣監管的區域同樣也可以使用到先進的AI基建能力。
4.AgentSpace新功能三件套上線
本次大會上,谷歌還在 Google Agentspace 中推出了三項新功能,讓創建和采用代理變得更加輕松,分別是:unified search、Agent Gallery、無代碼的Agent Designer。
圖片
其中,unified search是指用戶可以從Chrome瀏覽器的搜索框中進行統一代理搜索,旨在通過AgentSpace將谷歌的AI驅動的多模態搜索能力帶給企業,即這個搜索框可以找到任何形式的信息,無論是文本、圖像、網站、音頻還是視頻,而且具備谷歌搜索的搜索質量。它的厲害之處就在于可以幫助打通企業內部各部門的數據壁壘并將有利于企業構建適用于全部團隊與員工的企業知識圖譜,將分散的內容轉化為可操作的知識。
從今天開始預覽,AgentSpace已與Chrome企業版集成,員工可以直接從Chrome瀏覽器的搜索框中利用代理空間的“統一搜索”能力,在現有的工作流程中輕松且安全地找到信息、數據和資源。
其次,Agent的應用和構建也是業內所關注的。Agent Gallery和Agent Designer就是谷歌為此推出新功能。
代理畫廊(Agent Gallery)目前通過允許名單提供,為員工提供了一個查看整個企業中可用代理的單一視圖,包括來自谷歌、內部團隊和合作伙伴的代理——使代理易于發現和使用。客戶可以選擇在谷歌云市場中由合作伙伴發布的代理,然后在“代理畫廊”中啟用它們。
而代理設計器(Agent Designer),目前處于預覽階段并通過允許名單提供,是一個無代碼界面,用于創建連接到企業數據源并自動化或增強日常知識工作任務的自定義代理。即使是技術經驗有限的員工,也可以創建適合他們個人工作流程和需求的代理。
由于谷歌產品之間的深度集成,代理設計器還補充了Vertex AI代理構建器中可用的更深入的、以開發人員為中心的方法,而Vertex AI代理構建器中構建的代理可以發布到AgentSpace。
多提一嘴,除了專家代理,AgenSpace還支持一種新的代理與代理之間的開放協議(Agent2Agent,A2A)協議,該協議旨在讓不同生態系統中的代理相互通信。
作為推動這一行業計劃的首個超大規模云服務提供商,有理由相信這一協議對于支持多代理通信至關重要,因為它為代理提供了一種共同的語言——無論它們基于何種框架或供應商構建。這使得開發人員可以選擇最適合他們需求的工具和框架。(是不是想到了MCP協議~)
5.One More Thing:Gemini 2.5 Flash將開放
當然,谷歌不久前剛剛發布了自己的最強推理模型Gemini2.5和Gemini 2.5 Flash,在大模型競技排行榜Chatbot Arena中的“人類最后的考試”中獲得最高分,這是最難的行業基準之一,旨在捕捉人類知識和推理的前沿。Gemini 2.5 Pro現在可以在Google AI Studio、Vertex AI和Gemini應用程序中供所有人使用。
此外,值得一提的是,Gemini 2.5 Flash是谷歌目前內置“思考”功能的低延遲、最具成本效益的模型,也即將在 AI Studio 和 GeminiApp中推出。