LANL將中子星并合用于人工智能訓練模型
美國洛斯阿拉莫斯國家實驗室(LANL)開發的中子星并合模擬正在為Polymathic AI合作項目做出重要貢獻,該項目正在訓練人工智能模型,以幫助推動看似不同領域的科學發現。這些模擬準確地跟蹤了宇宙中一些最具活力的事件的后果,為基礎模型數據集提供了獨特的代碼,可以幫助訓練人工智能模型,使其能夠做出與天體物理學、生物學、聲學、化學、流體動力學等領域相關的預測。
中子星并合是指兩個中子星互相繞轉,釋放引力波,軌道能量損失,最終在劇烈碰撞、釋放引力波暴之后合二為一。
LANL的天體物理學家Jonah Miller說:“Polymathic AI項目專注于基礎模型。在基礎模型中,你需要一個人工智能模型,并在某個空間中盡可能多地訓練它。”“雖然一些人工智能模型是基于文本和語言構建的,但科學基礎模型是基于模擬的數據集構建的。在盡可能多的物理模擬信息上訓練網絡,使其能夠捕捉到在其他應用領域中有用的潛在趨勢。”
Miller將他的中子星并合模擬貢獻給了Polymathic AI發布的兩個數據集之一。該數據集被稱為“井”(The Well),包含生物系統、流體動力學、聲散射、超新星爆炸和其他復雜過程的數值模擬,包括Miller的專長中子星并合。這些并合發生在兩顆恒星在雙星軌道上度過數十億年后,然后碰撞并留下一個被高溫、富含中子的物質包圍的黑洞,這為伽馬射線爆發提供了動力,伽馬射線爆發是一種令人難以置信的高能光子的高能釋放。
這個劇烈的過程產生了我們宇宙中的重元素。一些聚變重元素的放射性衰變產生了一種光學到紅外的余輝,稱為千新星,可以在地球上看到。
利用模擬數據進行有價值預測
即使使用超級計算機,用于理解中子星并合的方程也很難求解。但是,當人工智能能夠檢測到一般趨勢時,例如質量守恒和/或能量守恒,它就可以使用原始數據來幫助研究人員在特定情況下進行預測,而不是運行昂貴而耗時的模擬。Miller的每一次模擬都用LANL300個核心的超級計算機上進行了三周;經過訓練的基礎模型或神經網絡可以補充這些昂貴的計算。
Miller說:“以這種方式使用人工智能的好處是,這種方法可以提取我們自己可能不知道的東西。”“基礎模型可以提供有助于保存模擬的預測,也有助于為未來更好的模擬提供信息。畢竟,物理定律是普遍的,我們編寫計算機代碼的方式依賴于某些數學規則。基礎模型可能會接受這些定律和規則。”
數據集可供免費下載
The Well是向公眾發布的兩個開源訓練數據集之一,可從Flatiron Institute免費下載,并可在托管AI模型和數據集的HuggingFace平臺上訪問。Polymathic AI團隊在加拿大溫哥華領先的機器學習會議NeurIPS上發表的一篇論文中提供了有關數據集的更多信息。
第二個數據集被稱為多模態宇宙,包含數億次天文觀測和測量,例如美國國家航空航天局James Webb太空望遠鏡拍攝的星系全景和歐洲航天局蓋亞航天器對我們銀河系恒星的測量。這些數據集共有來自數十個來源的115TB數據,供科學界用于訓練人工智能模型。