三體人有救了!深度學習解決三體難題
本文轉載自公眾號“讀芯術”(ID:AI_Discovery)
過去的十年里,深度學習助推了多個領域的最新發展。Deepmind在蛋白質折疊預測上的首次驚艷亮相,以及斯坦福大學學生研究蛋白質復合體結合的項目,都是使用深度學習進行細微研究的例子。
然而不止于此,深度學習的應用已經蔓延到了浩瀚宇宙之中。還記得連強大的三體人都對付不了的三個太陽嘛?沒錯,人工智能解決了。當然不止這一項應用,關于宇宙的研究包羅萬象。
本文將從機器學習和基礎科學的角度對項目的描述和影響進行評分,不過,本文將根據主觀趣味性來判斷,而不是引用指標。
來看看當AI在更遠的天際之中是如何大展身手的吧!
人工智能解決宇宙學中的三體問題
1. (Green等,2019) 概述:
總結:訓練多層感知器來預測簡單三體問題模擬中的未來狀態。
描述:4/3 三倍espressos。簡要來說,這個項目包含從可以解決困擾艾薩克·牛頓的復雜三體問題的人工智能,到以億倍速度解決三體問題的神經網絡。
圖源:ambrozewicz
此描述源于研究論文中的描述性方法,這種方法似乎是經過精確設計的,目的是讓專業領域之外的讀者在驚嘆不已。由于同時掌握深度學習和n體軌道力學的人寥寥可數,因此讀者很容易被陌生的細節吸引而錯過重點。
- 影響(機器學習):3/10致密層。在大卷積神經網絡無處不在的時代,使用深度多層感知器是很有趣的。
- 影響(物理學):3/n個大質量物體。
- 模型:具有ReLU激活的10層全連接神經網絡。
- 輸入:三體之一的起始位置和目標時間t。
- 輸出:三個粒子中的兩個在時間t的狀態。第三個粒子位置是由坐標參考系體現的。
- 代碼:https://github.com/pgbreen/NVM (僅使用預先訓練的模型權重進行推斷)
2. 詳解人工智能如何解決宇宙學中的三體問題
在經典軌道力學中,預測由兩個引力物體組成的單獨系統的未來狀態是比較容易的。再加上一個額外的物體,就有了著名的三體問題。
這是一個經典的例子,說明了在一個看似簡單的系統的動態相互作用中,混沌是如何出現的。混沌系統的一個特征是它們對初始條件表現出極端的敏感性,而且它們的行為似乎是隨機的。
這些狀態是很難預測的,而且混沌系統演化的時間越長,預測就越困難,因為之前的錯誤會不斷累積。這就是為什么智能體在實心磁極上學習比在連接磁極上學習要容易得多:
像雙擺這樣的混沌系統很難預測和控制
就像強化學習智能體奮力控制雙擺一樣,科學家們也發現很難預測像三體問題那樣的混沌系統的未來狀態。想靠蠻力計算?不是不行,但并不總是清楚需要多少數值精度,而且可能消耗大量資源。
本文作者使用一個10層的多層感知器從三體軌道問題預測未來的狀態。訓練數據由一個名為Brutus的蠻力數值模擬器計算。
筆者很喜歡看到“老式”的多層感知器,如果能欣賞在不同的訓練超參數和不同的架構下使用的代碼會很有趣。不幸的是,可用的公共代碼不提供任何訓練工具。
筆者同意最近的懷疑論,因為這篇論文的聲明是由一個非常狹窄和簡化的用例支持的,不太可能輕易地推廣到更復雜的情況。但要補充的是,結果并不像他們所宣傳的那樣夸張。
當模型被訓練用以預測更遠的未來時,其性能顯著下降,平均絕對誤差范圍約為0.01至0.2。當所討論的無單位數幾乎總是在-1和+1之間時,這些誤差就很大。訓練網絡進一步預測未來也會導致訓練集的過擬合,這個問題在討論中沒有提到。
圖源:radiichina
最有價值的領域:用深度學習發現更多系外行星
1. (Dattilo等,2019)概述機器學習如何幫助發現新行星
總結:開普勒太空望遠鏡在2013年發生故障,導致產生了大量噪音數據。研究人員訓練出了AstroNet-K2,作為之前模型AstroNet的修改版本,利用新的噪音數據,并發現了兩顆新的系外行星。這些行星通過后續觀測得到了驗證。
- 描述:1/3三倍espressos。《麻省理工學院技術評論》的文章是合理的,沒有對該項目做出夸大或不切實際的評價,但有時卻忽略了AstroNet-K2是基于一年前發布的AstroNet項目。
- 影響(機器學習):4/8卷積濾波器。AstroNet和AstroNet-K2之間的差異似乎在于超參數搜索和不同的數據集。
- 影響(系外行星天文學):AstroNet-K2發現了2/1076個已知[超級地球]
- (https://en.wikipedia.org/wiki/File:Size_of_Kepler_Planet_Candidates.jpg),并通過其他觀測得到驗證。筆者認為這個從本科開始的研究項目取得了非常有意義的成果。
- 模型:兩個獨立的卷積臂從輸入數據中提取特征。這些卷積層的輸出被輸入至四個完全連接的層,再輸出最終預測。輸入:開普勒望遠鏡K2運行的一維光曲線。
- 輸出:給定信號由凌日系外行星引發的概率。
- 代碼:https://github.com/aedattilo/models_K2
2. 詳解機器學習如何發現新行星
開普勒望遠鏡是一臺天基望遠鏡,旨在研究太陽系外的行星,也就是系外行星。1995年,迪迪埃·奎洛茲和米歇爾·馬約爾發現了第一顆圍繞著像我們這樣的恒星運行的系外行星,并因此獲得了2019年諾貝爾物理學獎。
圖源:unsplash
2009年開普勒發射后的十多年,已知系外行星總數還不到400顆。這架現已停用的望遠鏡于2009年開始運行,并發現了1000多顆新的系外行星,直到一個用于精確指向的反應輪部件于2013年失效。這標志著任務的主要階段結束。
一些巧妙的修改使望遠鏡開始了第二個數據采集階段,稱為K2。來自K2的數據噪音較大,且僅限于80天或更短的連續觀察。
要在數千個假設的行星信號中識別有希望的候選行星,這些限制是很大的挑戰,卷積神經網絡(AstroNet)曾很好地處理過這項任務,該網絡處理的是開普勒原始數據收集階段的數據。
得克薩斯大學奧斯汀分校的研究人員決定嘗試同樣的方法,并從AstroNet-K2的架構中衍生出AstroNet-K2,對K2行星信號進行排序。
經過訓練,AstroNet-K2在測試集中識別已確認系外行星的準確率達到98%,假陽性率很低。作者認為這種性能足以用作需要人工跟蹤的分析工具,但還無法完全實現自動化。論文如是說:
雖然我們網絡的性能還未完全達到產生全自動和統一的行星候選表所需的水平,但它可以作為一個概念的證明。—— (Dattilo等,2019)
這篇文章賦予了AstroNet-K2人們夢寐以求的“最佳價值”獎,因為它實現了一項重大的科學成果。與本文清單上其他兩個更多是概念性演示的項目不同,這一項目促成了實際的科學進展,在已知系外行星目錄中增加了兩個新的確認條目:EPIC246151543b和EPIC 246078672b。
除了K2數據的內在挑戰外,因火星穿過觀測窗口,以及安全模式事件導致了5天的數據缺失,行星的信號更加混亂。
圖源:unsplash
這是一個很好的有效機器學習的例子:作者們采用了一個已有良好記錄的卷積神經網絡,并對其進行了修改,使其在給定的數據上表現良好,在不重新發明的情況下,從一次艱難的觀察運行中添加了一些新的發現。
值得注意的是,這項研究的主要作者AnneDattilo在完成這項工作時還是一名本科生。對于一個本科生的研究項目來說,這個結果已經很好了。
作者使用了開放源碼軟件以及先前開發的架構,突出表明深度學習正處于高級準備階段。這項技術還沒有完全成熟到無處不在的地步,但是工具已經準備好,隨時可以應用。
CosmoGAN:引力透鏡的生成對抗網絡法
1. (Mustafa等,2019)概述
總結:宇宙中有一些丟失的質量,我們稱之為暗物質。來自這些缺失質量的引力使光線彎曲,宇宙學家可以根據光線被扭曲的方式來推測暗物質的位置。
深層卷積生成對抗性網絡擅長制作逼真的圖像,這些研究人員對其進行訓練來制作與暗物質分布相關聯的數據的圖像。
- 描述:1/3三倍espressos。基本上能找到的關于這篇論文的所有新聞報道都來自于勞倫斯伯克利國家實驗室的報道,這項工作就是在這一實驗室開展的。因此,這些報道并不會過分夸張或離奇,盡管對CosmoGAN實際用途的描述是模糊的(但這篇論文在這方面也不是很清楚)。筆者最喜歡的標題是宇宙科學家用神經網絡簡單地構建暗物質地圖。
- 影響(機器學習):6/64個潛在空間隨機變量。這是一個普通DCGAN,被訓練用于模擬引力弱透鏡數據。
- 影響(宇宙學):10個中有1個的質量是不可觀測的。
- 模型:CosmoGAN是一個DCGAN。每個網絡有4層,但是由于卷積濾波器較少,生成器具有比鑒別器(440萬)多約3倍的參數(1230萬)。參數視差是為了穩定訓練,保持鑒別器不偏離生成器。
- 輸入:64單位潛矢量(生成器),由CosmoGAN生成和模擬的(數值物理模擬器)弱透鏡收斂圖的二維圖像,可以對應暗物質分布(鑒別器),并與暗物質分布(鑒別器)進行比較。
- 輸出:可能的收斂圖(生成器),或給定圖像是真實(模擬)收斂圖(鑒別器)的概率
- 代碼:https://github.com/MustafaMustafa/cosmoGAN
2. 詳解生成對抗性網絡如何促成更好的引力透鏡
暗物質是一種比較神秘的物質形式,它占(普遍認為)宇宙質量的相當大比例(約85%)。
“暗”指的是這種形式的物質在正常觀測中是看不見的,而只能從引力效應中推斷出來,就像Vera Rubin在20世紀60年代觀測到的銀河系旋轉速度的差異一樣。
研究暗物質的一個基本可觀測因素是引力透鏡效應,在引力透鏡效應中,大質量物體會扭曲來自更遙遠物體的光線。當透鏡效應是由不可見的暗物質引起時,這就成為一個困難的反問題,需要大量模擬來解決。
圖源:unsplash
“如果你想從頭開始做一個蘋果派,你必須先發明宇宙”(Carl Sagan, Cosmos,《Carl Sagan, 宇宙》)。研究暗物質的存在也是一樣的:基于引力透鏡觀測建立暗物質圖的標準方法是創造一個(虛擬的)宇宙。
眾所周知,創造宇宙需要非常昂貴的計算費用,同時,為了檢驗一個高度模擬的宇宙是否與觀測結果一致,會大大限制所能完成的科學工作量。
當數據非常豐富,而足夠的計算量卻很少時,科學家們就會尋找方法來開發能夠解釋這些數據的替代模型,而不必每次都建立一個全新的宇宙。CosmoGAN就是這樣一種方法,它利用現代深度學習生成網絡來估算引力透鏡數據的收斂圖。
自Goodfellow等人在2014年提出生成對抗網絡以來,它已經取得了長足的進步。GAN框架是生成模型的一個(現在相當多樣化的)利基,它將生成網絡與鑒別或偽造檢測網絡相較。這兩個網絡相互對抗,產生越來越真實的合成數據,而鑒別器在檢測偽造方面也越來越好。
這種交互提供了純GAN訓練循環中唯一必需的訓練信號(盡管conditionalGANs這樣的變體可能會使用額外的數據),因此,在GAN訓練中平衡兩個網絡是一門藝術,而眾所周知,當這種平衡不均衡時,GAN容易出現不穩定的問題。
GANs十分難于訓練和解釋,但計算宇宙學家中有很多人參與了相關實踐,這可能會讓人有點驚訝。然而,CosmoGAN的范圍相當有限。生成器學習模擬統計上真實的收斂映射圖像,但這些與潛在空間中的隨機輸入無關。
在這種情況下,像古老的edges2cats演示背后的pix2pix方案這樣的conditionalGAN更有意義。這就是說,生成一張收斂圖是有用的,該圖可以合理地解釋給定天文圖像中的透鏡現象,這可以通過額外的觀測得到驗證。
還有,生成器產生的收斂圖是2維的,但暗物質實際上會分布在3維。作者們表示,其中一些局限性將在未來的工作中得到解決。
例如,一個“可控GAN(controllable GAN)”的提法聽起來與上面提到的conditionalGAN類似,而且他們確實打算為體積暗物質分布制作一個3維版本。如果是這樣的話,這個項目中的85%目前還無法觀察到。
毫無疑問,這三項應用讓我們看到了機器學習在宇宙學中的無限潛力,它們帶來了不可思議的發現和突破。事實上這并不難,不需要大膽地探索沒有科學家去過的地方,只是巧妙地實施一種經過驗證的技術,適應并應用于一個新的數據集,就能有發現,即使這只是使用模擬數據的概念探索。
但另一個問題是過度夸張,無論是媒體報道還是論文中的描述,這樣夸張的描述給AI的發展造成困擾。過度的描述會造成非生產性的反饋循環,會導致經濟/技術泡沫和研究資源的低效分配。這一點亟需被注意起來。