陶哲軒DeepMind夢幻聯動,最強通用科學Agent來了!一口氣解決芯片設計、矩陣乘法和300年幾何難題
Nature:「令人驚嘆」的通用科學人工智能來了!
谷歌DeepMind再次甩出一顆重磅炸彈:與陶哲軒等一眾頂尖科學家一起共同打造AlphaEvolve。
它可以設計出更快的矩陣乘法算法,可以改進芯片設計、提高數據中心、AI訓練的效率,已經在谷歌內部用上了。
它將Gemini架構中大型矩陣乘法運算加速了23%,從而將Gemini的訓練時間縮短了1%,谷歌程序員狂喜(bushi)。此外還將FlashAttention提速了32.5%。
幾百年前未曾解決過的數學問題,也都能因為它前進一大步。
比如一個經典的300年前的幾何挑戰接吻數(Kissing Number)問題。它關注的是,給定空間內球面相切的不重疊球體的最大數量。
一維空間和二維空間是這樣的。
AlphaEvolve發現了一個由593個外球體組成的結構,直接刷新了11維空間中的下限。
wiki百科上已經更新了記錄。
而它的潛力還在釋放當中,陶哲軒表示這個工作還在進行,接下來希望會匯報更多進展。搓搓手期待了~
目前它推出了早期邀測試用,在官網填寫表格,就有機會使用哦~不僅限學術圈的朋友。
AlphaEvolve:谷歌數據中心/芯片設計已經用上
AlphaEvolve是啥?按照官方介紹,這是個LLM驅動的進化編碼Agent,用于通用算法的發現與優化。
它包括三個部分:
- 大模型:綜合有關問題的信息以及以前解決問題的嘗試,并提出新版本的算法;
- 自動評估器:驗證、運行和評分所提出的算法。
- 進化框架:迭代改進所發現的最佳算法,并重新組合不同解決方案的想法,以找到更好的算法。
值得一提的是,這里的大模型是一系列大模型。
比如主打速度和效率Gemini Flash能夠最大限度地拓展探索的思路廣度;而性能更強的Gemini Pro則能夠提供深刻的深度和富有洞察力的建議。這些模型共同構建了以代碼形式實現算法解決方案的算法。
過去一段時間,AlphaEvolve提升了谷歌數據中心、芯片設計和AI訓練流程的效率,包括訓練AlphaEvolve本身所依賴的大模型本身。它還幫助設計了更快的矩陣乘法算法,并找到了解決開放性數學問題的新方法,展現出在眾多領域應用的巨大潛力。
具體來看。
優化計算生態系統。
過去一年,他們將AlphaEvolve發現的算法部署到了谷歌整個計算生態系統中,包括數據中心、硬件和軟件。
改善數據中心調度。
AlphaEvolve發現了一種簡單且有效方法,可以幫助Borg更高效地協調谷歌龐大的數據中心。
(Borg是一種集群管理器,它運行著來自數千個不同應用程序的數十萬個作業,這些作業分布在多個集群中,每個集群最多包含數萬臺機器。)
該解決方案已投入生產超過一年,平均持續恢復谷歌全球0.7%的計算資源。這種持續的效率提升意味著,在任何特定時刻,相同的計算資源占用空間可以完成更多任務。
除此之外,它還帶來了一些操作上面的優化:可解釋性、可調試性、可預測性和易于部署性。
協調硬件設計。
AlphaEvolve提出了一個Verilog重寫方案,刪除了矩陣乘法關鍵算術電路中高度優化的、不必要的位。
至關重要的是,該方案必須通過穩健的驗證方法,以確認修改后的電路保持功能正確性。該方案已被集成到即將推出的TPU中。
增強AI訓練和推理。
除此之外,AlphaEvolve還加速了Gemini的性能和速度。
通過找到將大型矩陣乘法運算劃分為更易于管理的子問題的更智能方法,AlphaEvolve將Gemini架構中的這一重要內核加速了23%,從而將Gemini的訓練時間縮短了1%。
除了性能提升,AlphaEvolve還大大減少了內核優化所需的工程時間,從專家數周的努力縮短到自動實驗的數天,使研究人員能夠更快地進行創新。
AlphaEvolve還能優化低級GPU指令。AlphaEvolve對基于Transformer的FlashAttention內核實現了高達32.5%的提速。這種優化可以幫助專家找出性能瓶頸,并輕松地將改進措施納入代碼庫,從而提高他們的工作效率,并在未來節省計算和能源。
推進數學和算法發現的前沿。
基于計算機程序的極簡代碼框架,它設計了一種基于梯度的新型優化程序的諸多組件,發現了矩陣乘法的多種新算法。
比如,它發現了一種使用48次標量乘法來對4x4復值矩陣進行乘法運算的算法,改進了Strassen于1969年提出的算法,該算法此前被認為是此類算法中的最佳算法。
與之前的AlphaTensor相比,后者專注于矩陣乘法算法,對于4x4矩陣,僅發現了二進制運算的改進。
他們還將該系統應用于數學分析、幾何學、組合學和數論領域的50多個未解決的問題。
在大約75%的案例中,它能夠重新發現最先進的解決方案。在20%的案例中,它改進了之前已知的最佳解決方案。
陶哲軒與DeepMind合作
2023年,他們的FunSearch首次證明大型語言模型可以生成用計算機代碼編寫的函數,如今在這基礎之上,已經展現出解決通用算法/數學問題的潛力。
從團隊上看也新增了不少合作者,谷歌之前的頂尖科學家,比如就有陶哲軒。
他們還與People+AI團隊一起建立了個用戶友好的交互界面。
雖然AlphaEvolve目前正被應用于數學和計算機領域,但其通用性意味著它可以應用于任何問題,其解決方案可以被描述為算法并自動驗證。
但他們相信,AlphaEvolve可以在材料科學、藥物發現、可持續發展以及更廣泛的技術和商業應用等更多領域帶來變革。