新方向!DeepMind提出人工生命框架,促進智能生物體的出現
近日,DeepMind 的研究者提出了一種人工生命框架,旨在促進智能生物體的出現。該框架中沒有明確的智能體概念,而是由原子元素構成的環境。這些元素包含神經操作,通過信息交換和環境中包含的類物理規則進行交互。研究者討論了進化過程如何導致由許多此類原子元素構成的不同生物體的出現,這些原子元素可以在環境中共存和繁榮。此外,研究者還探討了這如何構成通用 AI 生成算法的基礎,并提供了這種系統的簡化版實現,討論了需要做哪些改進才能進一步擴大規模。
論文地址: https:// arxiv.org/pdf/2101.0762 7.pdf
DeepMind 提出新系統
現實世界是由相互作用并組成更大實體的基本粒子構成的。DeepMind 研究提出的環境(AI 生成算法)是由元素構成的,但尺度較大。每個元素包含一個神經操作,比如矩陣乘法、外積,或者是包含這些算子的序列。這些元素通過某種形式的基本規則——一種物理類型,以及神經狀態的直接通信進行彼此交互。
該系統有多種實現。這篇論文提供了網格世界(grid-world)實現,其中的基本元素位于網格上,通過傳播信號或注意力機制進行通信,并與實現能量和類化學交換的底層物理進行通信。另一個例子是在三維空間中形成剛性零件的元素,這些零件可以通過連接點(joint)進行連接,連接點包含神經操作,通過與附近連接的零件交換信號來進行交互,并在連接點上設置扭矩。系統中可能存在多種類型的元素,并非所有元素內部都需要有神經網絡。
研究者在論文中提供了一種網格實現,突出顯示了許多重要屬性,并探討了要讓該系統變得強大需要進行哪些改進。
但是,該系統的潛力是無限的,它支持如下功能:
由多個元素組成的較大單元可以通過物理連接(如機器人)來形成,也可以簡單地作為一組決定進行通信并形成整體的單元。這些單元的潛在大小沒有限制。它們可以通過多種方式傳播——通過接管環境中的其他元素來生長(殖民地),也可以通過組裝新的副本進行復制,將適當的收集元素移動位置(例如機器人通過組裝碎片來復制自己)或自我組裝,或者它們可以生成完全不同的單元,這些單元可以實現專用的功能(一種有用的機器),或者比其前代產品更好的單元。而后者可能需要智能(intelligence)。
智能的能力
為什么說該研究提出的計算系統具有表示通用智能的能力,研究者提供了兩個論點:
首先,機器學習中已有的任何神經算法,或者未來可能創建的算法,都可以寫作一串操作序列,例如加法、矩陣乘法、外積和非線性運算,并在張量狀態下進行操作,例如由神經網絡的前向、后向和優化器操作產生的序列。AutoML-Zero 意識到了這一點,它直接搜索此類算子的序列以及與其所運行狀態的連通性,并且能夠學習基本的神經算法。由于這些算子是環境的基本構建元素,且能與任意連通性進行通信,因此所有的神經算法都可以在該系統中實現。
智能體假設
在該系統中,沒有智能體和環境之分,只有環境。元素本身可能形成也可能不形成進化單元,進化單元的繁殖會顯示出遺傳性但遺傳的區域并不確切。在前一種情況下,它們可以自主移動,收集能量并進行復制,形成更大的聚集體或復制生物體,因為這樣做具有優勢。而該研究則是針對后者,它需要最小數量的更簡單協作單元進行自我傳播。
SIM 的網格版本和通用屬性
該論文還介紹了自組織智能物質(self-organizing intelligent matter,SIM)的實例,討論了其各個方面,并提供了該研究認為它能夠構成 AI 生成算法的更多原因。
如上文所述,這里沒有內置的智能體概念,實際上只有一個環境。通常情況下,在兩個不同平臺上實現該系統是很不自然的:一個用于物理部分,例如物理模擬器;一個用于神經部分,如 TensorFlow、PyTorch 或 Jax 等神經網絡框架。該研究建議在單個平臺上制作這樣的系統。要產生智能行為,需要高效地運行神經網絡,因此該系統需要在后一種平臺上實現。出于靈活性的考慮,該研究選擇了 Jax。
Jax 在張量上運行,該研究用張量來存儲元素。這些元素需要交互,并具有形成任意大小靈活聚合體的能力。
實驗
該研究運行了上述系統,在一系列運行之間觀察到了令人興奮的多樣性,如圖 2 所示。
圖 2:運行結果。上面一行中,研究者用不同顏色代表 3 種不同的隨機權重。
如圖 2 上面一行中我們可以看到,在多個區域中,兩種元素都能夠穩定共存,即相同空間區域中存在不同顏色的點。并且這能持續很長時間,說明它們發現了一種共存的方式。