拿下所有榜單第一!「月更狂魔」谷歌,如何憑借算力帝國強勢炸場? 原創(chuàng)
北京時間凌晨,谷歌發(fā)布最新版Gemini 2.5 Pro。這款被譽為 “最智能” 的模型,首次在3月份宣布,隨后在5月份進行了升級。
?
?
此次更新,距離谷歌上次更新僅僅過去一個月。而「月更」的Gemini 2.5 Pro(06-05),不僅全方位打敗舊版模型,更在各大AI榜單中再次拿下第一。
?
在權(quán)威評測平臺LMArena的最新榜單上,相較于舊版本,LMArena測試分數(shù)提高了24分,WebDevArena 則提升了35分,當前在排行榜上名列前茅。
?
?
谷歌的基準測試顯示,該模型在編碼能力上超過了o3、o3-mini、o4-mini,Anthropi的Claude4Opus,以及xAI的Grok3Beta 和DeepSeek R1等競爭對手。
?
同時,在編碼能力方面,它也是碾壓級別的存在,在高難度的測試GPQA 和 “人類的最后考試”(HLE)測試中,Gemini2.5Pro顯示出其強大的智能化能力。
?
?
此外,谷歌回應(yīng)了用戶關(guān)于之前版本性能波動的反饋,表示已經(jīng)對模型在風格和結(jié)構(gòu)方面進行了優(yōu)化,使其更加具備創(chuàng)造性和清晰的回答格式,從而提升了用戶的交互體驗。
?
「月更」背后的算力引擎
?
谷歌的“月更”迭代速度在傳統(tǒng)AI研發(fā)中難以想象,其背后是谷歌全球分布的超級計算集群在提供支撐。
?
今年 4 月,谷歌發(fā)布第七代 TPU Ironwood——這顆專為深度思考模型打造的芯片,單卡算力達4614 Teraflops,媲美英偉達旗艦B200,而其自研的Jupiter光交換網(wǎng)絡(luò),可將9216塊芯片拼接為 42.5 ExaFLOPS(百億億次)的超級智算集群。
?
?
而其他競爭對手,以xAI為例,其為了訓(xùn)練Grok 3也配備了20萬個NVIDIA H100 GPU 組成的Colossus超級計算機,累計訓(xùn)練時長達2億GPU小時。
?
另一方面,算力投入正成為科技巨頭的關(guān)鍵一戰(zhàn)。
?
微軟、谷歌等AI巨頭全年資本支出大幅增長,并投入巨額資金用于服務(wù)器和數(shù)據(jù)中心的建設(shè)。
?
Meta更將年度資本開支計劃上調(diào),全力押注AI產(chǎn)品開發(fā)及數(shù)據(jù)中心建設(shè)。
?
算力:AI競賽的核心戰(zhàn)場
?
谷歌的閃電迭代揭示了一個殘酷現(xiàn)實:在當今AI競賽中,算力基礎(chǔ)設(shè)施已成為決定勝負的核心要素之一。
?
加強算力基礎(chǔ)設(shè)施建設(shè),正成為國內(nèi)外科技發(fā)展共識。
?
政策層面,中國正加速算力基礎(chǔ)設(shè)施建設(shè)。根據(jù)《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》,到2025年,中國智能算力在總算力中的占比將由現(xiàn)在的20%左右提升至35%。目前全國已有超過30個城市在建或籌建智算中心。
?
整個社會都在向數(shù)字化轉(zhuǎn)型,這輪AI發(fā)展的浪潮毋庸置疑會帶來一次新的工業(yè)革命和智能革命,整個算力產(chǎn)業(yè)都將成為人類社會基礎(chǔ)設(shè)施級的存在。
