預訓練通用神經網絡CHGNet,實現基于電荷的原子模擬
復雜電子相互作用的大規模模擬仍然是原子建模面臨的最大挑戰之一。盡管經典力場通常無法描述電子態和離子重排之間的耦合,但更準確的從頭算分子動力學受到計算復雜性的影響,無法進行長時間和大規模的模擬,而這對于研究技術相關現象至關重要。
近日,來自加州大學伯克利分校和勞倫斯伯克利國家實驗室的研究人員,提出了一種基于圖神經網絡的機器學習原子間勢(MLIP)模型:晶體哈密頓圖神經網絡(Crystal Hamiltonian Graph Neural Network,CHGNet),可以對通用勢能面進行建模。
研究強調了電荷信息對于捕獲適當的化學反應的重要性,并提供了對離子系統的見解,這些離子系統具有以前的 MLIP 無法觀察到的額外電子自由度。
該研究以「CHGNet as a pretrained universal neural network potential for charge-informed atomistic modelling」為題,于 2023 年 9 月 14 日發布在《Nature Machine Intelligence》上。
大規模模擬,例如分子動力學 (MD),是固態材料計算探索的重要工具。但電子相互作用或其在分子動力學模擬中的微妙影響的精確建模仍然是一個重大挑戰。經典力場等經驗方法通常不夠準確,無法捕獲復雜的電子相互作用。
從頭算分子動力學 (AIMD) 與密度泛函理論 (DFT) 相結合,可以通過顯式計算密度泛函近似內的電子結構,產生具有量子力學精度的高保真結果。長時間、大規模的自旋極化 AIMD 模擬對于研究離子遷移、相變和化學反應至關重要,具有挑戰性且計算量極大。
諸如 ?net 和 DeepMD 之類的 MLIP,為彌合昂貴的電子結構方法和高效的經典原子間電勢之間的差距提供了有希望的解決方案。然而,包含化合價對化學鍵的重要影響仍然是 MLIP 的一個挑戰。
電荷以多種方式表示,從簡單的氧化態標簽到從量子力學推導出的連續波函數。將電荷信息納入 MLIP 的挑戰來自于許多因素,例如表示的模糊性、解釋的復雜性、標簽的稀缺性等。
CHGNet 架構
CHGNet 根據材料項目軌跡數據集(Materials Project Trajectory Dataset,MPtrj))的能量、力、應力和磁矩進行了預訓練,該數據集包含 10 多年對超過 150 萬個無機結構的密度泛函理論計算。明確包含磁矩使 CHGNet 能夠學習并準確表示電子的軌道占據,從而增強其描述原子和電子自由度的能力。
MPtrj 數據集中元素的分布如下圖所示。
圖示:MPtrj 數據集的元素分布。(來源:論文)
在此,研究人員將電荷定義為一種原子屬性(原子電荷),可以通過包含磁矩(magmoms)來推斷。研究表明,通過明確地將特定位點 magmoms 作為電荷態約束納入 CHGNet 中,既可以增強潛在空間正則化,又可以準確捕獲電子相互作用。
CHGNet 的基礎是 GNN,其中圖卷積層用于通過由邊 {eij} 連接的一組節點 {vi} 傳播原子信息。GNN 中保留了平移、旋轉和排列不變性。CHGNet 以具有未知原子電荷的晶體結構作為輸入,并輸出相應的能量、力、應力和 magmoms。電荷裝飾結構可以從現場 magmoms 和原子軌道理論推斷出來。
圖示:CHGNet 模型架構。(來源:論文)
在 CHGNet 中,通過在原始單元中每個原子 vi 的內搜索相鄰原子 vj,將周期性晶體結構轉換為原子圖
。
與其他 GNN 不同,其中 t 個卷積層后更新的原子特征 直接用于預測能量,CHGNet 正則化 t?1 卷積層的節點特征
以包含有關巖漿的信息。正則化特征
攜帶有關局部離子環境和電荷分布的豐富信息。因此,用于預測能量、力和應力的原子特征
是受其電荷態信息約束的電荷。因此,CHGNet 可以僅使用核位置和原子身份作為輸入來提供電荷態信息,從而可以研究原子建模中的電荷分布。
CHGNet 在固態材料中的應用
研究人員展示了 CHGNet 在固態材料中的幾種應用。展示了 Na2V2(PO4)3 中原子電荷的電荷約束和潛在空間正則化,并展示了 CHGNet 在 LixMnO2 中的電荷轉移和相變、LixFePO4 相圖中的電子熵以及石榴石型鋰超離子導體 Li3+xLa3Te2O12 中的鋰 (Li) 和擴散率。
為了合理化對原子電荷的處理,使用 NASICON 型鈉離子陰極材料 Na4V2(PO4)3 作為說明性示例。除了從 V 原子核的空間配位中學習之外,在沒有任何有關 V 離子電荷分布的先驗知識的情況下,CHGNet 成功地將 V 離子區分為三價 V 和四價 V 兩組。
圖示:Na2V2(PO4)3 中的 Magmom 和隱藏空間正則化。(來源:論文)
在 LixFePO4 的研究中強調了 CHGNet 區分 的能力,這對于包含電子熵和有限溫度相穩定性至關重要。
圖示:來自 CHGNet 的 LixFePO4 相圖。(來源:論文)
在 LiMnO2 的研究中,證明了 CHGNet 能夠通過長時間的電荷信息 MD 深入了解異價過渡金屬氧化物體系中電荷歧化和相變之間的關系。
圖示:Li0.5MnO2 相變和電荷歧化。(來源:論文)
接下來,研究了 CHGNet 對于通用 MD 的精度。以石榴石導體中的 Li 擴散為研究對象。
圖示:石榴石 Li3La3Te2O12 中的鋰擴散率。(來源:論文)
結果表明,不僅精確捕獲了活化擴散網絡效應,而且 CHGNet 的活化能量與 DFT 結果非常一致。證明了 CHGNet 能夠精確捕獲活化的局部環境中鋰離子之間的強相互作用,以及模擬高度非線性擴散行為的能力。此外,CHGNet 可以顯著降低模擬擴散率的誤差,并通過擴展到納秒級模擬,能夠對擴散率較差的系統進行研究。
可進一步改進
盡管取得了以上進步,但仍可實現進一步的改進。
首先,使用 magmom 進行價態推斷并不能嚴格確保全局電荷中性。
其次,雖然 magmom 對于離子系統中自旋極化計算的原子電荷來說是很好的啟發式方法,但人們認識到非磁性離子的原子電荷推斷可能是不明確的,因此需要額外的領域知識。因此,對于沒有 magmom 的離子,以原子為中心的 magmom 無法準確反映其原子電荷,CHGNet 將從環境中推斷電荷,類似于其他 MLIP 的功能。
還可以通過結合其他電荷表示方法來進一步增強模型,例如電子定位函數、電極化和基于原子軌道的劃分。這些方法可用于潛在空間中的原子特征工程。
總之,CHGNet 能夠實現基于電荷的原子模擬,適合使用大規模計算模擬來研究異價體系,從而擴大了計算化學、物理學、生物學和材料科學中電荷轉移耦合現象的研究機會。
論文鏈接:https://www.nature.com/articles/s42256-023-00716-3