可控核聚變新里程碑!AI成功預測等離子體撕裂登Nature,清潔能源「圣杯」更近一步
可控核聚變,又有新突破了!
長期以來,核聚變一直受著一個「幽靈」的困擾——等離子體不穩定性問題。
而最近,普林斯頓團隊用AI提前300毫秒預測了核聚變等離子不穩定態,這個時間,就足夠約束磁場調整應對等離子體的逃逸!
從此,科學家可以防止可控核聚變的中斷,產生足夠能量所需的高功率聚變反應,也就更有可能了。
這項重大突破,成果已經登上Nature。
論文地址:https://www.nature.com/articles/s41586-024-07024-9
可控核聚變重大難題,被AI突破
幾十年來,科學家一直努力在地球上實現核聚變。
因為人類社會未來面臨的能源枯竭問題,很可能會被可控核聚變解決。它有望為我們提供無窮無盡的清潔能源,甚至徹底改變我們應對氣候危機的方式。
通過強制原本相互排斥的兩個原子融合在一起,就能實現聚變。
聚變的過程與當前廣泛使用的核裂變過程正好相反,后者依賴于分裂原子
聚變發生在兩個原子——通常是輕原子,如氫——合并成一個更重的原子的過程中,釋放出巨大的能量。
這個過程是太陽的能量來源,也間接支撐了地球上的生命。然而,讓兩個原子實現融合非常困難,因為需要極大的壓力和能量,才能來克服它們之間的相互排斥力。
太陽之所以能實現聚變反應,靠的是它巨大的引力和核心處的極高壓力。而為了在地球上模擬這一過程,科學家們采用了極度熾熱的等離子體和強大的磁場。
圖片
在托卡馬克(外形像甜甜圈)中,磁場會努力控制溫度超過1億攝氏度的等離子體,這比太陽中心的溫度還要高
然而,核聚變過程中,專家們常常只能實現短暫的聚變能量維持,過程中存在諸多不穩定性。
這是因為,在實現可核聚變能的過程中,最關鍵的步驟之一,就是輸入氫變體燃料,在托卡馬克中將其升溫,產生類似于「湯」的等離子體。
但等離子體很難控制——它極易「撕裂」,并且逃逸出用來約束它的強大磁場。
幸運的是,最近普林斯頓大學和普林斯頓等離子體物理實驗室的研究人員在Nature上報告,他們發現了一種方法,可以利用AI預測這種潛在的不穩定性,并且實時防止實驗中斷。
這個團隊,由工程師、物理學家、數據科學家組成。
從左到右:Azarakhsh Jalalvand、Egemen Kolemen和Ricardo Shousha
在圣地亞哥的DIII-D國家聚變設施進行的實驗中,研究團隊發現——
他們的AI控制系統能夠在提前300毫秒時,就預測到等離子體的潛在撕裂。
而如果沒有這種干預,聚變反應很可能就會突然中斷!
研究人員利用AI預測并避免了撕裂不穩定性的形成(左圖),這種不穩定性可能會迅速導致等離子體破壞和聚變反應終止
至此,長期以來阻礙核聚變發展的等離子體不穩定性問題,終于被人類攻克了。
這項發現,也極大提升了科學家們的信心。
普林斯頓大學的機械與航空航天工程系教授、研究報告作者之一的Egemen Kolemen為我們解釋了,為什么這項發現如此意義重大。
中斷和不穩定性,是可控核聚變的重大障礙之一,我們都希望任何反應堆都能持續穩定運行多年。現在開發出這樣的解決方案,大大增強了我們的信心,現在我們有可能無故障地運行這些裝置了。
AI成功實現等離子體狀態控制策略
AI是如何實現的?
研究人員展示的模型顯示,它可以僅通過分析過去的實驗數據,而非依賴物理模型,就能預測出「撕裂模式不穩定性」(也即潛在的等離子體不穩定性)。
而且,它最多能提前300毫秒就預測出來!
對人類來說,這段時間可能只是眨一次眼,但對于AI控制器來說,就已經足以讓它調整操作參數,避免等離子體磁場的內部撕裂,從而維持其穩定狀態,防止反應提前結束。
在這個過程中,AI成功地實時在真實反應器中,實現了一個穩定、高能量等離子體狀態的控制策略。
這種方法,比原有的方法更為動態。
論文一作、韓國中央大學物理學助理教授Jaemin Seo解釋說:「以往的研究通常專注于在等離子體中出現這些撕裂不穩定性后,抑制或減輕其影響。但我們的方法能夠在它們形成之前就預測到,并且避免這些不穩定性。」
AI+等離子體物理學=?
研究人員會想到AI,也是因為,撕裂模式不穩定性發生得實在太突然、太快了!
要在幾毫秒內反應過來,迅速處理新數據、作出響應,唯有AI才能做到。
然而,開發一個有效的AI控制系統并非易事。
更何況,在托卡馬克環境下,實驗時間極其寶貴,風險又極高。
在論文合著者Azarakhsh Jalalvand看來,教AI算法控制托卡馬克中的聚變反應,就像教人開飛機一樣。
你不僅要給AI鑰匙,讓它自己摸索,還要讓它在復雜的飛行模擬器中反復練習,直到掌握了足夠的技能。
深度神經網絡
因此,普林斯頓團隊采用了DIII-D托卡馬克過去實驗的數據,構建了一個深度神經網絡,這個網絡能夠根據實時的等離子體特征,預測未來撕裂模式不穩定性的發生概率。
利用這個神經網絡,研究人員訓練了一個強化學習算法。
這個算法就像一個正在學習的飛行員,通過在模擬環境中的試錯,學習控制等離子體的各種策略,找出哪些是有效的,哪些是無效的。
Jalalvand解釋說,他們并沒有向強化學習模型傳授聚變反應的復雜物理知識,而是告訴它:你的目標是維持高功率反應、避免撕裂模式不穩定性,并指出可以調整的參數。
在無數次的模擬聚變實驗中,模型嘗試尋找方法來維持高功率水平,同時避免不穩定性。
隨著時間的推移,算法自己就學會了在避免不穩定性的同時,達到高功率反應的最優路徑!
合著者SangKyeun Kim說:「我們能看到模型的意圖背后的邏輯。有時模型想要的改變太快了,我們就需要讓模型的行為更平滑、更穩定。作為人類,我們需要在AI的意圖和托卡馬克的實際容忍度之間,找到一個平衡。」
當研究人員對AI控制器的能力有了足夠信心后,他們就在D-III D托卡馬克的實際聚變實驗中進行了測試,觀察控制器如何實時調整特定參數來避免不穩定性的發生,包括改變等離子體形狀和輸入反應的束流強度。
結果顯示,AI果然能夠成功預測出不穩定性!
這樣,研究人員就不再被動,不需要等到等離子體失控已經發生后,再采取措施了。
用于控制的強化學習系統設計
根據論文的介紹,研究人員設計的AI控制器,能夠根據監測到的等離子體狀態自動調節控制器的工作,從而在確保等離子體穩定性的同時,盡可能提升其壓力。
圖1:系統設計框架
圖1a和1b:實驗中的一個典型等離子體樣本,以及研究所選用的診斷工具和控制設備。其中,在q = 2磁通面上,可能會發生2/1模式撕裂不穩定現象。
圖1c:能夠處理測量信號,并生成對應的執行器指令的控制系統架構。
圖1d:基于DNN的AI控制器能夠根據經過訓練的策略,決定整體束流功率和等離子體形狀的高級控制命令。等離子體控制系統(PCS)則負責計算磁線圈的控制信號和各個束流的功率,確保既滿足AI控制器設定的高級控制需求,也遵守用戶設定的限制條件。
系統設計
為了高效產生聚變能源,關鍵在于保持等離子體的高壓力,同時避免引發可能導致設備突然停止運行的不穩定現象。
然而,當通過中性束等方式加熱等離子體以提高其壓力時,就會遇到一個閾值(圖2a中的黑線)。
超過這個閾值,等離子體就會出現撕裂不穩定現象,這可能很快導致等離子體破裂(圖2b和2c)。
值得注意的是,這個穩定性閾值會隨著等離子體狀態的變化而變化,而且在某些情況下,降低壓力也可能引發不穩定現象。
正如圖2中的藍線所示,通過根據等離子體的狀態調整控制器的工作,就可以在不引發不穩定現象的前提下,追求更高的等離子體壓力。
圖2:AI撕裂規避系統對托卡馬克的控制和等離子體的反應
實際上,我們可以把它理解成一個「避障問題」,其中的障礙物便是迫使實驗終止的風險因素。
具體到核聚變本身,就是控制托卡馬克裝置,使等離子體沿著一個既保持高壓力又不超出穩定極限的狹窄路徑運行。
為了實現這一目標,研究人員通過強化學習方法訓練了一個Actor模型,設計了一個獎勵函數R來衡量等離子體在可接受的撕裂風險下能達到多高的壓力。
這里的β_N代表等離子體壓力的歸一化值,T表示撕裂風險,而k則是人為設定的一個安全閾值。更具體的,β_N和T是AI控制器采取行動后25毫秒的預測結果。
根據這一預測,如果撕裂風險低于我們設定的閾值,Actor模型將根據等離子體的壓力獲得正向獎勵;反之,則獲得負向獎勵。
為了根據方程(1)獲得更高的獎勵,Actor首先需要通過其控制動作來提升β_N的值。
但是,β_N的增加可能會導致等離子體變得不穩定,并最終使得撕裂指標(T)超過安全閾值(k),這會導致獎勵減少。特別地,當T超出k時,獎勵會急劇減少。
因此,控制智能體會優先考慮保持T在安全閾值k以下,而不是單純追求提高β_N。
通過充分的強化學習訓練,Actor最終可以找到一種平衡策略,既能追求等離子體的高壓力,又能確保撕裂指標保持在安全范圍內。
這種策略允許托卡馬克在放電過程中沿著一個精確規劃的路徑運行,如圖2d所示。
圖2:AI撕裂規避系統對托卡馬克的控制和等離子體的反應
由于撕裂的發生在很大程度上取決于其空間信息和梯度,因此觀測變量被設定為以磁通坐標映射的一維動力學和磁性剖面。
具體來說,觀測的是電子密度、電子溫度、離子旋轉、安全系數和等離子體壓力的曲線。
實驗結果
圖3b中的黑線展示了一個因撕裂不穩定而導致的等離子體中斷的例子。
在這次放電中,使用傳統反饋控制維持了特定的參數水平(β_N = 2.3)。然而,在2.6秒時,出現了嚴重的撕裂不穩定現象,導致參數急劇下降,最終在3.1秒時引發了等離子體中斷。
圖3b中的藍線,是在AI控制下的束流功率和等離子體的形狀。圖3c和圖3d分別展示了具體控制過程中,等離子體形狀和束流功率的調整情況。
這次放電期間,AI控制器根據等離子體的實時數據,制定出束流功率和形狀的調整指令,由等離子體控制系統(PCS)轉化為具體的操作,如調整磁線圈電流和精確控制八束束流的功率。
圖3e中的藍線,是對AI控制放電的后續估計。可以看到,整個過程中撕裂傾向被有效控制在預定閾值以下,完全符合預期。
這次實驗不僅證明了相比傳統控制方法,AI控制能夠更有效降低撕裂風險,還展示了其在整體性能上相比參考實驗的提升,體現了AI適應性控制的優勢。
圖3:基于AI能的撕裂規避實驗
圖4a展示了應用不同設置閾值的控制器進行的三場實驗,分別為0.2、0.5和0.7。
其中,當閾值設為0.5和0.7時,等離子體能夠穩定持續,直到實驗結束都沒有出現破壞性的不穩定現象。
圖4b至4d展示了三次實驗后分析得到的撕裂傾向情況。圖中的背景色顯示了在每個時間點不同束流功率下的預測撕裂傾向,實際使用的束流功率則由黑線標出,虛線表示不同閾值下的撕裂傾向等級。
可以看到,不同的閾值設置會讓AI控制展現出不同的行為特征。
圖4b的分析顯示,撕裂預測模型能在不穩定發生前300毫秒預警,控制器也試圖進一步減少束流功率。
在圖4c中,設置了k = 0.5的AI控制器通過提前采取措施,主動避免觸及閾值,以應對不穩定性的警告。
由于獎勵機制是根據控制器行動后25毫秒的撕裂傾向來計算的,所以經過訓練的控制器會在警告發生前的數十毫秒采取行動。
圖4:不同閾值設置的對比實驗
點亮未來之路
研究人員指出,雖然這項工作成功證明了AI在有效控制聚變反應方面的潛力,但這只是推動聚變研究領域的第一步。
首先,他們計劃在DIII-D上收集更多證據,證明AI控制器的實際效果,然后將其應用范圍擴大到其他的托卡馬克裝置。
「我們有充分的證據顯示這個控制器在DIII-D上表現出色,但我們需要更多數據來證明它能夠應對多種不同的情況,」一作Seo表示。「我們的目標是開發出更具通用性的解決方案。」
第二個研究方向是擴展這個算法,使AI控制器能夠同時處理更多的不穩定問題。
曾在Kolemen團隊做研究生,目前是PPPL博士后研究員,也是共同作者的Ricardo Shousha解釋說:「你可以想象,有一個綜合的獎勵函數,它調整多個參數,以此來同時控制多種不穩定性。」
在開發更優秀的AI控制器以控制聚變反應的過程中,研究人員們還可能對等離子體底層物理有了更深入的理解。
通過分析AI控制器在維持等離子體穩定時所作出的決策,可以發現它們往往與傳統方法大相徑庭。
這表明,AI不僅能夠成為控制核聚變反應的有效工具,還能作為一種新的教學資源,幫助我們從不同角度理解和探索聚變科學。
團隊介紹
Jaemin Seo
一作Jaemin Seo,是專注于在KSTAR和DIII-D項目中應用機器學習技術進行等離子體預測與控制的博士后研究員。
Jaemin在首爾國立大學核工程系獲得了博士學位。期間,他創新性地利用強化學習方法,為KSTAR設計了一種新型的等離子體控制算法。
目前,他的研究重點轉向了在DIII-D項目中探索撕裂模式的預測與控制技術。
此外,Jaemin還在研究一種快速的神經網絡模型,旨在實時重建等離子體的動力學平衡狀態,這對于提高控制算法的效率和精確度具有重要意義。
Egemen Kolemen
通訊作者Egemen Kolemen,是普林斯頓大學機械與航空航天工程的副教授,并在Andlinger能源與環境中心以及普林斯頓等離子體物理實驗室(PPPL)擔任職位。
作為可持續能源項目的負責人,他因其在聚變工程領域的卓越貢獻獲得了David J. Rose優秀獎,并被選為ITER科學家研究員。
Kolemen教授的研究致力于將工程技術與物理分析相結合,旨在開發經濟效益高的聚變反應堆。目前,他正帶領團隊在KSTAR、NSTX-U 和 DIII-D項目中進行機器學習、實時監測與控制方面的研究。