成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AlphaEvolve: 谷歌DeepMind邁向通用人工智能(AGI)的突破性一步

譯文 精選
人工智能
AlphaEvolve的核心是一個由大型語言模型(LLM)驅(qū)動的自我進化流程。該流程不僅僅生成輸出,還能夠跨代對代碼進行變異、評估、選擇和改進。AlphaEvolve從一個初始程序開始,通過引入精心設(shè)計的變更進行迭代優(yōu)化。

譯者 | 李睿

審校 | 重樓

谷歌DeepMind推出的AlphaEvolve旨在自主發(fā)現(xiàn)算法和科學(xué)解決方案。它基于進化計算原理,通過LLM驅(qū)動的獨立進化流程,不斷優(yōu)化代碼。AlphaEvolve不僅超越人類專家設(shè)計的算法,還在數(shù)學(xué)和谷歌基礎(chǔ)設(shè)施優(yōu)化上取得突破。其自主創(chuàng)造力和持續(xù)自我改進能力,為邁向通用人工智能(AGI)和超級人工智能(ASI)提供了新方向。

谷歌DeepMind最近發(fā)布了AlphaEvolve,這是一種進化式編碼代理,旨在自主發(fā)現(xiàn)新算法和科學(xué)解決方案。在主題為《AlphaEvolve:用于科學(xué)和算法發(fā)現(xiàn)的編碼代理》的論文中,這項研究代表了向通用人工智能(AGI)甚至超級人工智能(ASI)邁出了突破性的一步。AlphaEvolve沒有依賴于靜態(tài)微調(diào)或人類標記的數(shù)據(jù)集,而是走上了一條以自主創(chuàng)造力、算法創(chuàng)新和持續(xù)自我改進為核心的完全不同的道路。

AlphaEvolve的核心是一個由大型語言模型(LLM)驅(qū)動的自我進化流程。該流程不僅僅生成輸出,還能夠跨代對代碼進行變異、評估、選擇和改進。AlphaEvolve從一個初始程序開始,通過引入精心設(shè)計的變更進行迭代優(yōu)化。

這些變更以LLM生成差異的形式呈現(xiàn)——由LLM根據(jù)先前的示例和明確的指令給出代碼修改的建議。軟件工程中的“差異”是指文件的兩個版本之間的差異,通常會突出顯示要刪除或替換的行以及要添加的新行。在AlphaEvolve中,LLM通過分析當前程序,并根據(jù)包括性能指標和以往成功編輯的提示提出一系列微調(diào)建議(例如添加函數(shù)、優(yōu)化循環(huán)或更改超參數(shù))來生成這些差異。

然后,使用針對任務(wù)定制的自動評估器對每個修改后的程序進行測試。最有效的候選程序會被存儲、引用,并作為未來迭代的靈感來源進行重組。隨著時間的推移,這個進化循環(huán)會催生出越來越復(fù)雜的算法,而這些算法往往超越了人類專家精心設(shè)計的算法。

了解AlphaEvolve背后的科學(xué)

AlphaEvolve的核心是建立在進化計算原理的基礎(chǔ)上,進化計算是受到生物進化啟發(fā)的人工智能的一個子領(lǐng)域。該系統(tǒng)從代碼的基本實現(xiàn)開始,將其視為初始的“有機體”。 在歷經(jīng)多代的迭代進化過程中,AlphaEvolve修改了這段代碼(引入變異或“突變”),并使用定義良好的評分函數(shù)評估每個變異的適用性。性能最好的變體能夠存活下來,并作為下一代的模板。

這種進化循環(huán)通過以下方式協(xié)調(diào):

  • 提示采樣:AlphaEvolve通過選擇和嵌入以往表現(xiàn)卓越的代碼示例、性能指標和特定任務(wù)的指令來構(gòu)建提示。
  • 代碼突變和建議:該系統(tǒng)使用強大的LLM(Gemini 2.0 Flash和Pro)的組合,以差異的形式對當前代碼庫進行特定的修改。
  • 評估機制:自動評估功能通過執(zhí)行并返回標量分數(shù)來評估每個候選程序的表現(xiàn)。
  • 數(shù)據(jù)庫和控制器:分布式控制器協(xié)調(diào)這個循環(huán),將結(jié)果存儲在進化數(shù)據(jù)庫中,并通過MAP-Elites等機制平衡探索和利用。

這種反饋豐富、自動化的進化過程與標準的微調(diào)技術(shù)截然不同。它使AlphaEvolve能夠生成新穎、高性能、有時甚至違反直覺的解決方案,從而突破了機器學(xué)習(xí)自主實現(xiàn)的界限。

AlphaEvolve與RLHF的比較

為了了解AlphaEvolve的創(chuàng)新之處,將其與人類反饋強化學(xué)習(xí)(RLHF)進行比較至關(guān)重要,RLHF是一種用于微調(diào)大型語言模型的主要方法。

在RLHF中,人類的偏好被用來訓(xùn)練獎勵模型,該模型通過像近端策略優(yōu)化(PPO)這樣的強化學(xué)習(xí)算法來指導(dǎo)LLM的學(xué)習(xí)過程。RLHF提高了模型的一致性和實用性,但它需要大量的人工參與來生成反饋數(shù)據(jù),并且通常在靜態(tài)的、一次性的微調(diào)機制中運行。

相比之下,AlphaEvolve可以:

  • 從進化循環(huán)中刪除人類反饋,以支持機器可執(zhí)行的評估器。
  • 通過進化選擇支持持續(xù)學(xué)習(xí)。
  • 由于隨機突變和異步執(zhí)行,探索更廣泛的解決方案空間。
  • 可以生成不僅一致,而且新穎且具有科學(xué)意義的解決方案。

在RLHF微調(diào)行為的地方,AlphaEvolve被發(fā)現(xiàn)并發(fā)明。在考慮AGI的未來發(fā)展軌跡時,這種區(qū)別至關(guān)重要:AlphaEvolve不僅能做出更好的預(yù)測,還能找到通往真理的新途徑。

應(yīng)用與突破

1.算法發(fā)現(xiàn)和數(shù)學(xué)進展

AlphaEvolve已經(jīng)證明了它在核心算法問題上有突破性發(fā)現(xiàn)的能力。最值得關(guān)注的是,它發(fā)現(xiàn)了一種僅使用48次標量乘法即可將兩個4×4復(fù)值矩陣相乘的新算法——超過了德國數(shù)學(xué)家Volker Strassen在1969年得出的49次乘法的結(jié)果,打破了56年來的理論上限。AlphaEvolve通過先進的張量分解技術(shù)實現(xiàn)了這一點,該技術(shù)經(jīng)過多次迭代進化,優(yōu)于幾種最先進的方法。

除了矩陣乘法之外,AlphaEvolve還在數(shù)學(xué)研究方面做出了重大貢獻。它在組合數(shù)學(xué)、數(shù)論和幾何學(xué)等領(lǐng)域的50多個開放問題上進行了評估。在大約75%的案例中,它達到了已知的最佳結(jié)果,并在大約20%的案例下超越了這些結(jié)果。這些成功包括對Erd?s最小重疊問題的改進、11維接吻數(shù)問題的更密集解決方案以及更高效的幾何填充配置。這些結(jié)果凸顯了其作為自主數(shù)學(xué)探索者的能力——在沒有人為干預(yù)的情況下改進、迭代和進化越來越優(yōu)化的解決方案。

2.谷歌計算堆棧的優(yōu)化

AlphaEvolve還在谷歌公司的基礎(chǔ)設(shè)施上帶來了顯著的性能提升:

  • 數(shù)據(jù)中心調(diào)度方面,它發(fā)現(xiàn)了一種新的啟發(fā)式方法,可以改善作業(yè)安排,回收了之前閑置的0.7%計算資源。
  • 對于Gemini的訓(xùn)練內(nèi)核,AlphaEvolve為矩陣乘法設(shè)計了更好的平鋪策略,使內(nèi)核加速了23%,訓(xùn)練時間減少了1%。
  • TPU電路設(shè)計中,它確定了RTL(寄存器傳輸級)算術(shù)邏輯的簡化,經(jīng)過工程師驗證,并包含在下一代TPU芯片中。
  • 它還通過編輯XLA中間表示優(yōu)化了編譯器生成的FlashAttention代碼,將GPU上的推理時間縮短了32%。

總之,這些結(jié)果驗證了AlphaEvolve在多個抽象級別(從符號數(shù)學(xué)到低級硬件優(yōu)化)上運行的能力,并實現(xiàn)了性能提升。

  • 進化編程:這是一種使用變異、選擇和繼承來迭代改進解決方案的人工智能范式。
  • 代碼超級優(yōu)化:自動搜索功能的最有效實現(xiàn)方式——通常產(chǎn)生令人驚訝的,違反直覺的改進。
  • 元提示進化:AlphaEvolve不僅僅是進化代碼;它還發(fā)展了如何將指令傳遞給LLM,從而實現(xiàn)了編碼過程的自我完善。
  • 離散化損失:這是一個正則化術(shù)語,鼓勵輸出與半整數(shù)或整數(shù)值對齊,這對數(shù)學(xué)和符號的清晰度至關(guān)重要。
  • 幻覺損失:這是一種將隨機性注入中間解決方案的機制,鼓勵探索并避免局部最小值。
  • MAP-Elites算法:這是一種質(zhì)量多樣性算法,可在特征維度上保持高性能解決方案的多樣性,從而實現(xiàn)穩(wěn)健的創(chuàng)新。

3.對AGI和ASI的影響

AlphaEvolve不僅僅是一個優(yōu)化器——它是對未來智能代理可以展示自主創(chuàng)造性的一個窗口。該系統(tǒng)能夠制定抽象問題并設(shè)計自己的解決方法,這是朝著通用人工智能(AGI)邁出的重要一步。這超越了數(shù)據(jù)預(yù)測:它涉及結(jié)構(gòu)化推理、策略形成和適應(yīng)反饋——這是智能行為的標志。

其迭代生成和改進假設(shè)的能力也標志著機器學(xué)習(xí)方式的一種進化。與需要大量監(jiān)督訓(xùn)練的模型不同,AlphaEvolve通過實驗和評估的循環(huán)來改進自己。這種動態(tài)形式的智能使其能夠在沒有直接人類監(jiān)督的情況下導(dǎo)航復(fù)雜的問題空間、丟棄性能不佳的解決方案,并強化那些表現(xiàn)優(yōu)異的方案。

通過執(zhí)行和驗證自己的想法,AlphaEvolve同時充當了理論家和實驗家的角色。它超越了執(zhí)行預(yù)定義的任務(wù),進入了發(fā)現(xiàn)的領(lǐng)域,模擬了自主的科學(xué)過程。每個擬議的改進都經(jīng)過測試、基準測試和重新整合,從而可以根據(jù)實際結(jié)果而不是靜態(tài)目標進行持續(xù)改進。

也許最值得關(guān)注的是,AlphaEvolve是遞歸自我改進的早期實例——人工智能系統(tǒng)不僅學(xué)習(xí),還增強了自身的組件。在一些實例中,AlphaEvolve改進了支持其基礎(chǔ)模型的訓(xùn)練基礎(chǔ)設(shè)施。盡管仍受當前架構(gòu)的限制,但這種能力開創(chuàng)了先例。隨著可評估環(huán)境中出現(xiàn)更多問題,AlphaEvolve可能會朝著越來越復(fù)雜和自我優(yōu)化的行為發(fā)展——這是超級人工智能(ASI)的一個基本特征。

AlphaEvolve的局限性和未來發(fā)展

AlphaEvolve目前的局限性是它對自動評估函數(shù)的依賴。這就限制了它的應(yīng)用范圍,使其僅限于可以用數(shù)學(xué)或算法形式化的問題。它還不能在需要默契的人類理解、主觀判斷或物理實驗的領(lǐng)域中有意義地運作。

然而,未AlphaEvolve來的發(fā)展方向包括:

  • 混合評估的整合:將符號推理與人類偏好和自然語言批評相結(jié)合。
  • 在模擬環(huán)境中部署,實現(xiàn)具體的科學(xué)實驗。
  • 將進化的輸出蒸餾到基本LLM中,創(chuàng)建功能更強、樣本效率更高的基礎(chǔ)模型。

這些發(fā)展趨勢指向越來越多能夠自主解決高風(fēng)險問題的代理系統(tǒng)。

結(jié)論

AlphaEvolve是一個重大的進步——不僅在人工智能工具方面,而且在人們對機器智能本身的理解方面。通過將進化搜索與LLM推理和反饋相結(jié)合,它重新定義了機器能夠自主發(fā)現(xiàn)的內(nèi)容。這是一個早期但重要的信號,表明具有真正科學(xué)思維能力的自我改進系統(tǒng)已不再是理論性的。

展望未來,支撐AlphaEvolve的架構(gòu)可能會遞歸地應(yīng)用于其自身:進化其自身的評估器、改進變異邏輯、改進評分函數(shù),并針對其依賴的模型優(yōu)化底層訓(xùn)練管道。這種遞歸優(yōu)化循環(huán)代表了一種邁向AGI的技術(shù)機制,在這種機制下,AlphaEvolve不僅僅完成任務(wù),還改進了使其能夠?qū)W習(xí)和推理的基礎(chǔ)設(shè)施。

隨著時間的推移,AlphaEvolve在更復(fù)雜和抽象的領(lǐng)域擴展,以及人類對這一過程的干預(yù)減少,它可能會表現(xiàn)出加速的智能提升。這種自我強化的迭代改進循環(huán)不僅適用于外部問題,也適用于其自身的算法結(jié)構(gòu),是AGI及其可以為社會帶來的所有好處的關(guān)鍵理論組成部分。憑借其創(chuàng)造力、自主性和遞歸性,AlphaEvolve不僅僅是DeepMind旗下的一款產(chǎn)品,而且可能是第一個真正意義上通用并且具備自我進化能力的人工智能的藍圖。

原文標題:AlphaEvolve: Google DeepMind’s Groundbreaking Step Toward AGI,作者:Antoine Tardif

責任編輯:姜華 來源: 51CTO內(nèi)容精選
相關(guān)推薦

2024-01-16 10:22:23

人工智能大型語言模GPT 4

2023-02-28 15:21:37

人工智能AGI

2023-11-22 15:53:45

2022-06-20 11:05:58

通用人工智能機器人

2023-10-12 15:37:24

人工智能AGI

2023-03-28 14:46:11

2022-06-27 11:24:20

人工智能術(shù)語AI

2022-07-04 15:29:59

人工智能機器計算機

2022-05-13 14:56:03

人工智能DeepMind

2025-02-14 16:08:19

2023-07-10 10:36:17

人工智能AI

2021-02-06 10:43:49

人工智能

2022-07-31 23:46:57

人工智能語言模型感知力

2020-10-16 10:27:58

人工智能

2023-05-17 10:36:18

人工智能自主系統(tǒng)驅(qū)動

2023-03-23 13:35:08

ChatGPT人工智能

2022-06-16 16:19:12

模型神經(jīng)網(wǎng)絡(luò)

2023-02-25 21:48:36

人工智能技術(shù)

2025-05-19 09:02:00

點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产成人精品免高潮在线观看 | 日本不卡高字幕在线2019 | www.色综合| 午夜免费在线电影 | 日韩一区二区在线播放 | 国产精品久久国产精品 | 亚洲精品视频导航 | 99热在线观看精品 | 狠狠躁天天躁夜夜躁婷婷老牛影视 | 九九色综合 | 日韩在线精品视频 | 欧美不卡一区二区三区 | 日本黄视频在线观看 | 久久99精品久久久久久 | 日韩中文字幕免费 | 久久国产精品99久久久久久丝袜 | 久久久久久久久国产精品 | 精品久久久久久中文字幕 | 国产91亚洲精品一区二区三区 | 久久黄色精品视频 | 午夜精品久久久 | 天天操夜夜操 | 国产成人精品久久 | 在线日韩欧美 | 久久人人国产 | 亚洲激情网站 | 欧美在线视频a | 欧美8一10sex性hd | 久久草视频| 黄色一级免费 | 亚洲国产精品久久久 | 成人久久| 久久av一区 | 国产精品成人一区二区三区夜夜夜 | 日韩免费中文字幕 | 国产精品国产三级国产a | 欧美一级片免费看 | 国产欧美一区二区三区在线看 | 亚洲天堂中文字幕 | 99综合| 午夜一级做a爰片久久毛片 精品综合 |