谷歌開源基于物理模擬的氣象模型,能預測暴雨、臺風、大干旱
傳統的通用循環模型(GCMs)在天氣預報和氣候模擬方面發揮了重要作用,但在處理特殊狀態的小尺度時存在局限性,例如,處理云、輻射和降水等未完全解析的物理過程時會使用半經驗性參數化,會導致模型在匹配歷史數據時的調參過程仍然依靠手動設置,且GCMs自身存在許多持續的錯誤和偏見。。
所以為了克服這些困難,谷歌提出了基于物理模擬的神經通用環流氣象模型NeuralGCM,并已經開源提供給各大氣象機構測試和使用。
相比傳統氣象模型,NeuralGCM在預測暴雨、臺風、大干旱、熱帶氣旋等突發惡劣天氣方面非常出色,能夠使用歷史海表面溫度數據準確跟蹤數十年的氣候指標。
開源地址:https://github.com/google-research/neuralgcm
動態核心相當于NeuralGCM模型的“心臟”,這是一個基于物理的數值求解器,負責解決大氣的流體動力學和熱力學方程。
動態核心采用偽譜方法進行水平離散化,結合垂直的sigma坐標系統,有效地捕捉大氣中的波動和渦旋現象。能夠處理包括風的渦度和散度、溫度、地表壓力以及水分形態等多種預報變量,為氣象模型提供了堅實的物理基礎。
NeuralGCM的物理模擬模塊通過深度學習技術,特別是神經網絡的應用,對那些傳統GCMs難以捕捉的小尺度過程進行了有效的參數化。這些小尺度過程,包括云層的形成、輻射傳輸、降水等,對于天氣模式的形成、預測至關重要。NeuralGCM通過單列方法,為每個大氣柱提供定制化的預測,顯著提高了模型對這些復雜現象的捕捉能力。
NeuralGCM的神經網絡架構是其智能適應性能的關鍵。全連接的神經網絡,配備殘差連接,使得網絡的輸入可以直接影響輸出,從而提升了模型的學習能力。
網絡的輸入參數包括預報變量、太陽輻射、海冰濃度和海表面溫度等,而其輸出則為預報變量的傾向性,這些傾向性進一步用于更新動態核心的狀態。
為了確保NeuralGCM能夠與現有的氣象數據集無縫集成,研究人員開發了編碼器和解碼器。這些組件在壓力坐標和sigma坐標系統之間架起了橋梁,使得模型可以準確地使用和預測數據。
編碼器負責將觀測數據轉換為模型的初始條件,而解碼器則在模型完成時間步進后,將預測結果轉換回我們熟悉的壓力水平。在預訓練過程中,NeuralGCM采用了端到端的訓練方法。通過將模型推進多個時間步,然后使用隨機梯度下降來最小化模型預測與再分析之間的差異。
研究人員逐漸增加了滾動長度,從6小時到5天,這對于模型在多日預測的準確性和穩定性至關重要。此外,他們還訓練了確定性和隨機的NeuralGCM模型,每種模型都使用了獨特的訓練協議。
隨機模型則還引入了內在的隨機性,通過在神經網絡組件中添加隨機場,使用連續排名概率分數(CRPS)作為損失函數,以鼓勵準確性和集合的多樣性。
為了評估NeuralGCM的性能,研究人員進行了一系列的測試,包括均方根誤差、均方根偏差、連續排名概率得分等。
從功率譜的角度來看,NeuralGCM - 0.7°的功率譜比其他機器學習預測方法更接近ERA5,但仍比ECMWF的物理預測模糊。隨著分辨率的提高,NeuralGCM的譜變得更準確,這表明在更高分辨率下訓練的模型有進一步改進的潛力。
在水預算方面,NeuralGCM中的平流由動力學核心處理,機器學習參數化模型模擬大氣垂直列中的局部過程。NeuralGCM可以隔離局部源和匯,從而更便于診斷水預算。對于短天氣預測,降水減去蒸發的平均值具有非常接近ERA5數據的現實空間分布。
在地理風平衡方面,與GraphCast相比,NeuralGCM更準確地描繪了中緯度地區驅動大規模動力學的主要力量之間的平衡,地理風的垂直結構和非地理風以及它們的比率。