世界首次!智源研究院實現數字孿生心臟電功能超實時仿真
心臟,作為重要器官之一,其功能正常與否直接影響人類的生命延續。電生理特性反映了心臟的健康和疾病狀態。心臟電生理活動的異常,往往會導致心律失常,從而引至心臟泵血功能衰竭等嚴重健康問題。因此,深入理解和研究心臟的電生理過程,對于提高心臟病的診斷和治療水平至關重要。
傳統的心臟電生理研究多依賴于實驗室內的動物模型和臨床數據,但這類方法往往受限于倫理問題、實驗條件和數據獲取的復雜性。隨著計算技術的發展,計算機仿真成為了一種新興且強大的研究工具。通過建立數學模型和計算機程序,研究人員可構建數字孿生心臟,能夠在虛擬環境中仿真并重現心臟器官的電生理活動(虛擬生理心臟),分析其動態特性,并進行不同生理與病理條件下的實驗。
虛擬心臟電生理仿真對計算資源要求極高,即使是幾毫秒的仿真,也需要累積求解數十億次微分方程。使用復雜的虛擬心臟模型進行研究時,重現 1 秒鐘的心臟電活動也可能需要數小時或更長。這給虛擬生理心臟的臨床應用與藥物研發帶來重大挑戰。
為解決這一問題,智源研究院開發了一套實時心臟電生理仿真系統。該系統不僅能夠實時模擬心臟的 3D 電活動,還能通過多種參數的調節,深入探討不同生理、病理因素對心臟功能的影響。
這一實時心臟仿真平臺,一方面可在醫學基礎研究領域發揮作用,幫助臨床醫生和研究人員更直觀地理解心臟的電生理過程,探究心律失常產生機制、預測猝死發生率等;另一方面,可用于構建虛擬藥物安全性評估平臺,對推動藥物安全評估發展具有重要意義;更重要的是,可以在臨床應用中提供手術方案預演與決策支持,比如射頻消融方案規劃,心臟起搏器最佳植入方案規劃等。該技術的推進將為醫學研究和臨床治療提供新的范式。
1 虛擬心臟仿真發展史
虛擬生理心臟的構建可利用生理組學的研究方法,綜合分子生物學、生物化學、生理學、解剖學及臨床醫學的最新成果,數學化以及模式化地整合從基因、蛋白質、細胞、組織到器官的解剖(多物理尺度:空間尺度跨越 10^9 量級,跨時間尺度:時間尺度跨越 10^15 量級,如圖 1 所示)、生理和生化信息,應用計算機強有力的計算和圖形顯示能力,通過賦予其心臟所具有的動力學特性、生化特性和各種生理病理特點,使之從形態、結構和功能等方面逼真地再現心臟的生理和病理活動過程。
圖注 1:構建虛擬生化生理人體的時間和空間尺度。時間尺度橫跨由分子事件(μs)、細胞信號傳導(ms)、細胞功能(s)到人體壽命 (decades) 的 10^15 跨度。空間尺度橫跨由分子(nm)、細胞(μm)、器官(cm)到軀干 (m) 的 10^9 跨越。
虛擬生理心臟研究可追溯與上世紀五十年代。1952 年諾貝爾獎得主 Hodgkin 和 Huxley 建立了世界上第一個細胞計算模型 — 烏賊神經元細胞模型 [1],開創了用計算模型研究生物問題的先河。1960 年 Denis Noble [2] 在 Nature 雜志上發表了第一個心肌細胞計算模型 — 浦肯野心肌細胞模型,開創虛擬生理心臟模型的先例。此后幾十年的研究中,不斷有研究人員研發針對不同物種、心臟不同組織、復雜精密的心肌細胞電生理模型 [3]。1991 年,Peter Hunter 等人 [4] 基于犬實驗數據構建了第一個心臟解剖結構模型,融合多物理尺度與電生理的虛擬心臟模型研究進入新階段。此后,多尺度、多物理模態的心臟計算模型陸續出現,并被成功應用于心臟功能研究與藥物安全性評估 [5-8]。
在早期虛擬生理心臟研究中,心臟一個生物秒的電生理活動往往需要數日甚至數月來仿真計算。隨著顯存技術的發展,這個時間縮短到數天。近年,有研究致力于提升虛擬生理心臟的計算速度。比如通過將三維心臟空間劃分為矩形子區域來實現并行心臟模擬 [9],使運算速度大大提升。另一項研究通過 WebGL 將高性能心臟模擬擴展到普通計算機上 [10],甚至有 GPU 的手機也可以模擬三維心室的電動態。一些研究試圖通過自適應時間步長來提高運行速度 [11,12],結果表明,固定時間步長比自適應時間步長方法具有更好的效率 [11]。
但這些研究僅能達到「準實時運算」,離真正意義上的「實時運算」,即仿真時間與生物時間比達到 1:1,還有難以逾越的距離,更不用說仿真精度的提升帶來的運算量爆炸式增長。高計算復雜度帶來的海量運算,使得虛擬生理心臟模型難以實現實時計算,阻礙其大規模應用。
2 實時計算
為了在更高分辨率、更高精度和更大規模的心臟模型上實現實時仿真,智源研究院開發了具有精確細胞電生理與解剖結構的人心室模型。該模型包含了 19 種細胞生理狀態變量和 70 多個公式,能夠實現復雜的心臟電生理與病理仿真,為臨床與醫藥工業應用提供豐富的場景。
為實現實時計算,智源對模型底層計算進行了深度優化。針對心臟仿真中計算強度大和 I/O 密集等瓶頸問題,智源充分結合 A100 平臺的硬件特點,設計了多種優化策略,如量化和循環展開。這些措施有效降低了計算復雜度和 I/O,使得在更大規模和更高復雜度的心臟模型上實現了 180 倍的速度提升。
最終,智源虛擬心臟仿真系統實現了對心臟電生理功能的實時仿真,達到生物時間與計算時間比為 1:0.84。這一成果不僅提升了心臟仿真系統的性能,還為更廣泛的醫學研究和臨床應用提供了強有力的支持,標志著心臟仿真技術的又一重大里程碑進展。
圖注 2:實時心臟計算概覽圖。
2.1 技術路線
在 GPU 的架構設計中,順序訪問內存(如連續的數據訪問)相較于隨機訪問具有更高的性能。此外,在執行順序訪問時,通常會采用預取技術提前加載數據,以進一步提高訪問效率。
同時,在虛擬心臟模型中,大約有 2/3 的物理空間位置是空余腔體空間,有效心肌組織僅占 1/3 的物理空間。心臟仿真的主要計算和 I/O 操作都集中在對有效心肌組織中的每一個單細胞中的離子通道和細胞膜電位進行時間上的精細更新,同時考慮鄰近細胞的電耦合影響。
基于 GPU 訪存特點和心臟解剖結構的特殊性,我們設計了適合稀疏數據的數據結構。利用順序訪存提升 I/O 速度,確保并行線程僅處理有效細胞,從而最大限度地提高 GPU 內存的利用率。通過這種創新的結構,顯著優化了計算性能,使得心臟仿真能夠在 IO 訪存上達到最優效果。
圖注 3:心臟模型有效數據在 GPU 內存上的排布。
在計算層面,采用量化策略,有效簡化模型中的對數和指數等復雜計算,從而顯著降低了計算復雜度。
此外,為進一步減少 I/O 操作次數,采用循環展開策略,實現在一次讀取中進行多次計算,大大降低 I/O,顯著提升 SM 核心的計算利用率。
基于 A100 平臺,我們設計了高效的 P2P 通訊方式,利用 GPU 直連實現在節點內快速的數據交換,確保數據傳輸的低延遲與高帶寬。在節點之間,采用 RDMA(遠程直接內存訪問),進一步增強跨節點數據傳輸的效率,充分發揮硬件平臺的并行計算與通訊能力。
圖注 4:技術路線圖。
2.2 仿真結果
我們測試了不同優化策略對仿真 2 生物秒心臟功能所用計算時間的影響,結果如下圖所示。對 2 生物秒心臟功能的模擬,基準模型在未優化的情況下 A100 單卡需要計算時間為 304.25 秒。在采用分布式、量化、循環展開策略后,其所用時間分別是 9.75、3.93、1.68 秒。其中采用循環展開后,計算時間達到 2 秒內,達到計算時間 / 生物比小于 1,實現實時 / 超實時計算的要求。其中,分布式計算對于系統仿真速度影響最大,達到了 32 倍提速。量化策略和循環展開策略分別將仿真速度提升了 2.48 和 2.34 倍。在同時采用分布式、量化、循環展開策略的情況下,系統仿真速度整體提升了 181 倍。
圖注 5:不同優化策略的計算時間。
圖注 6:不同優化策略的速度提升。
2.2.1 拓展曲線
圖注 7:不同優化策略的拓展曲線。
如圖 7 擴展曲線所示,隨著 GPU 卡數的增加,基準模型和優化后的模型仿真時間都在減少。基準模型在增加到 48 卡后,計算時間不再減小。此時的生物:計算時間比為 1:5。再采用量化和循環展開策略后,32 張卡即可實現實時計算,生物:計算時間比達到 1:0.84。
2.2.2 主要 GPU 指標
圖注 8:不同優化策略的計算密度和計算強度。
圖注 9:不同優化策略的內存和 SM 利用率。
通過 GPU 指標可以看出(圖 8,圖 9)量化策略通過提升 IO 同時降低計算的方式提高整體計算性能;循環展開通過大幅度降低 I/O 同時提高計算密度的方式提高計算性能。
2.2.3 計算精度
我們統計了加速前與加速后的結果誤差,仿真的膜電位 V 的時程差別 < 2 ms (0.6%),模電位平均誤差為 0.72mV (0.4%),均滿足生理準確度要求。優化前后主要離子通道的仿真曲線吻合(如圖 10 所示)。
圖注 10:仿真前后細胞主要離子通道電流與胞內離子濃度在一心律節拍間的變化。
3 總結
智源研究院從心臟模型的解剖結構、心肌細胞電生理的計算特點及計算系統的硬件架構出發,設計了心臟仿真系統的數據結構和優化策略,以提高計算效率。我們采用先進的并行處理方法,充分利用現代 GPU 設備的強大計算能力,優化數據傳輸和通訊方式,以減少延遲并提高數據吞吐量。通過這些策略,不僅提升了仿真系統的計算速度,還保證了在可接受誤差范圍內的計算精度,最終成功實現了心臟仿真的實時計算目標,達到超實時計算結果。這一成果為進一步研究心律失常產生的離子通道與分子機制等關鍵醫學問題,也為手術規劃如房顫射頻消融方案等臨床應用,以及新藥研發與其心臟安全性篩選奠定了堅實基礎,同時也為其它超大復雜物理系統的實時仿真提供堅實基礎。