利用基于GPU的AI模擬一個現實宇宙 僅需36分鐘
科學家已經習慣于使用超級計算機處理宇宙學領域的海量數據,最近卡耐基梅隆大學的研究團隊找到一種新方法,可以使用常規的機器學習技術(與AI繪畫或作曲擁有同樣的底層設計),在圖形處理單元(GPU)上實現高級模擬能力。
這個名為“無人在此”(This Person Does Not Exist)的研究項目,嘗試使用大家熟知的硬件與神經網絡技術以高分辨率形式模擬我們的現實宇宙。這項極具前瞻性的研究,也許會徹底改變我們認識宇宙與理解物理定律的方式。
根據研究小組的說法,使用傳統方法在單一處理核心上運行宇宙學模擬大約需要23天。因此,研究人員傾向于使用超級計算機完成此類仿真任務。之所以如此困難,是因為物理學中仍充斥著種種懸而未決的根本問題。我們找不到一套能夠解釋整個宇宙的統一規則,科學家們也不清楚如何將經典物理學定律同量子領域中觀察到的現象聯系起來。
為此,我們必須努力探索。在涉及到預測宇宙中暗物質數量等難題時,科學家必須嘗試不同的預設數值。只有這樣反復試錯,才能最終得出更接近真實情況的結果??茖W家們開始著手模擬,并將發現與太空望遠鏡及其他觀測結果數據源進行核對,之后再模擬、再核對,如此反復。
問題所在
超級計算機的運行成功率極高,租用一個小時往往就要花掉數千美元。與單一GPU的低功耗水平相比,超級計算機簡直就像是個熊熊燃燒的大火爐。
所以對于這類需要反復試驗的問題,超級計算機顯然不是最好的解決方案。
路在何方
研究人員將問題歸結為:目前,我們可以先對宇宙中的小塊圖像進行高分辨率模擬,并在大型模擬區域內轉為低分辨率圖像模擬。至于大型區域的高分辨率圖像處理必須慎而又慎,因為這會耗費掉大量時間、精力與能源。
但這樣的現狀,相當于在模擬整個宇宙時設下一道不可逾越的鴻溝。貫通天塹的橋梁,就是AI。
卡耐基梅隆大學團隊選擇的方案并非教導AI以程序化方式模擬整個宇宙(這仍然可能設定無窮多個變量),而是直接以高分辨率形式進行圖像模擬。
這大大提升了模擬效率。具體提升了多少?卡耐基梅隆大學的Jocelyn Duffy表示:經過訓練的代碼能夠獲取完整的低分辨率模型并執行超高分辨率模擬,將其中包含的粒子數量擴展達512倍。對于宇宙當中直徑約5億光年、包含1.34億個粒子的區域,原有方法需要560個小時才能在單一處理核心上完成高分辨率模擬;而使用新方法后,研究人員僅僅需要36分鐘。在向模擬流程中添加更多粒子后,效果變得更為顯著。對于包含1340億個粒子的“千億”(相較于上一用例)宇宙,研究人員的新方法在單一圖形處理單元中只需要16個小時即可處理完成。如果使用原有方法,這種大小及分辨率的模擬必須配合專用的超級計算機,處理時長也將達到數月之久。
這不是說AI真能“理解”我們所無法企及的宇宙空間。相反,它只是在以令人信服的方式將低分辨率模擬圖像擴充為高分辨率形式,幫助科學家以更少的時間、精力與能源投入獲得可靠的模擬結果。
從本質上講,這就像是為AI提供電影的分鏡草稿,再由它輸出實拍影片的具體樣貌。雖然還不夠完善,但已經可以在一定的保真水平下省去真實拍攝的麻煩。
實際過程當然要比本文的描述復雜得多。但好在模擬出的宇宙圖像比較容易驗證,我們可以直接把結果跟觀測數據進行比較。唯一的謎團,是我們并不知道AI模型是如何完成填充的。
這項最新成果,讓宇宙學模擬從超級計算機的專利變成了完全可以運行在游戲PC上的“小case”,研究人員也可以借此快速測試自己的靈感、推動模擬能力的大眾化轉型。
從樂觀的角度來說,這項研究有望徹底改變我們對現實宇宙的觀察方式。如果運氣好,我們也許能更好地對暗物質、引力效應甚至是宇宙起源作出原理性解釋。