將數字孿生融入醫療保健領域的十大基本要素
數字孿生的核心優勢在于集中捕捉數據、提升反饋獲取效率并實施有效干預,從而徹底顛覆我們所熟知的整個醫療保健思路。但完成這一目標的難點,在于實現模擬所需要的信息往往廣泛分散在各類醫療記錄、可穿戴設備、移動應用以及無處不在的傳感器當中。
醫學領域的數字孿生方案可以使用自然語言處理(NLP)、API及圖數據庫等原始數字成分實現數據理解,同時消除噪音以歸納當前客觀模式。更重要的是,研究人員還可以對這些原始材料進行重組以建立起醫療機構、藥物乃至醫療設備的數字孿生副本,借此改善醫療效果并降低運營成本。目前,其他行業也已經在建筑、產品開發及供應鏈管理中通過類似的方式建立起新的純數字化工作流程。
“活的”數據系統
醫學數字孿生的一大發展承諾,就是不僅能在生病時幫助我們摸清問題、治療病癥,甚至有望減緩我們的衰弱速度。專門投資數字醫學初創企業的OMX Ventures公司董事總經理Dan Fero在采訪中表示,“數字孿生代表著一套「活的」數據系統,它能夠隨時間推移持續接收縱向生物數據,跟蹤并不斷從變化著的數據集中學習,借此反映人體的當前健康狀況乃至持續健康軌跡。”
這項工作的第一步就是測量并跟蹤生物數據,例如膽固醇水平、維生素含量與醫學成像結果。此外,系統還需要引入更復雜的其他數據點,例如基因組、表觀遺傳、代謝組學以及免疫功能等數據。
Fero解釋道,“目前,我們在面對這些相互孤立的數據集時已經能夠做出「一定程度」的推斷,但還沒有能力把這些數據集真正聯系起來、再借助這種聯系展望人體未來可能發生的健康水平變化。”在他看來,下階段的發展目標就是開展數據編碼以大規模創建數字孿生。現在已經有Q Bio等幾家公司投入到這項意義重大的工作中來。
Fero還強調,“我認為這將是個極具吸引力的領域。此領域將在接下來的幾十年中不斷發展,而這一切的基礎就是我們不斷探索如何獲取新的生物數據點、篩選這些數據點以把握可能影響健康變化的重要及預后指標,將海量數據集關聯起來以解釋整個生命體系的運作方式,最終找到一條準確可靠的縱向跟蹤、甚至能夠扭轉病患長期健康狀態的道路。”
很明顯,當前構建數字孿生的要素還不夠完備,但我們已經看到了一些可喜的希望。下面,我們就一同了解這十大基本要素在醫學數字孿生領域各自發揮的作用:
電子健康記錄
第一大要素就是記錄系統,即醫療保健行業的電子健康記錄(EHR)。電子健康記錄系統負責收集診療交互、用藥跟蹤、治療計劃與實際效果等信息。目前全球領先的電子健康記錄廠商包括Cerner Corporation、Epic Systems以及Meditech等。
這些系統能夠為醫療組織提供靜態信息基準。但要想更進一步、超越現有醫療保健流程與跨供應商擴展,還有很多現實挑戰需要克服。猶他大學的一項研究發現,2018年內有33%的診療計劃無法及時發現有風險、甚至致命性的藥物配伍錯誤。雖然這一結果已經2011年的46%有了很大改善,但與理想狀態仍有不小的距離。
但目前的電子健康記錄方案普遍提供對藥物組合的安全檢測功能,所以研究人員們推測導致藥物配伍不能被及時發現的原因,很可能是各家醫院根據自身工作流程進行系統定制時干擾到了這些檢測功能。最終得出的結論就是需要投入更多精力以提高數據質量,并將發現集成到各家廠商的系統當中。
Health Data Analytics Institute(健康數據分析研究院)CEO Nassib Chamoun在采訪中提到,“醫生必須在有限的時間內利用殘缺不全的信息做出幾十項關于診斷和治療的重要決定。遺憾的是,現有電子健康記錄中的數據無論是數量還是質量還遠遠跟不上實際需求。”
本體
為了在不同組織、不同環境下準確描述事物并保證可理解性,語言也就應運而生。所謂本體,就是借由標準化的數據含義及其與其他概念間的聯系,幫助人們在混亂當中建立起秩序。作為典型的跨學科領域,醫療行業也孕育出了豐富的本體。目前美國國家生物醫學本體中心已經列出953項醫學本體,具體包含1300萬個種類。
Semantic Arts公司(一家專門為業務系統提供本體專業知識服務的商業咨詢企業)總裁、《Data-Centric Revolution》一書作者Dave McComb表示,“醫學非常復雜,無法被整合進單一的數據模型當中。”
目前已經有努力在對這些浩如煙海的不同本體加以聯合,其中包括雄心勃勃、定位為全球最詳盡醫學本體的SNOMED-CT項目。但McComb也承認,這些努力還沒有完全解決程序員如何編碼這些數據結構的問題,例如如何在命名、驗證、安全性、完整性及應用代碼等層面準確表達含義。但只要邁過這道難關,數字孿生就有望依靠智能API網關、NLP與現實世界證據平臺等工具連通各個數據孤島。
圖數據庫
圖數據庫特別適合把涉及不同概念(例如癥狀與疾病)的異構數據同醫療記錄、測試結果與診斷記錄整合至統一的系統當中。從實踐層面來看,相當一部分數字孿生用例也都要求把不同類型、不同來源的數據紡織起來以探索其中的模式,所以圖數據庫自然可以為此貢獻力量。
Neo4J圖數據科學總監Alicia Frame在采訪中表示,“我們發現已經有很多制藥和保險企業利用圖數據庫技術從電子健康記錄中獲得大量有價值信息——包括將電子健康數據導入圖數據庫以摸清因果關系,或者快速發現異常的行為模式等。”以制藥界巨頭阿斯利康為例,他們就使用電子健康記錄數據與圖數據庫跟蹤上市新藥、改善患者治療效果。
某大型保險公司就利用TigerGraph圖數據庫整合了200多個數據源,借此提高了呼叫中心服務過程中查詢患者病歷記錄的效率。以此為基礎,客服人員能夠快速調出全部診斷、索賠、處主補充及咨詢通話等信息,將呼叫中心的單位處理時長縮短了十分之一、也成功提高了反映客戶滿意度的凈推薦值。
但Frame也發現,在Epic、Cerner等醫院當中,圖數據庫還較少被作為電子健康記錄的配套數據庫。她感嘆道,“我個人認為這種滯后源自陳舊技術的遺留影響,也反映出存儲健康記錄數據與理解記錄數據間仍然存在鴻溝——相信在逐步推廣之后,圖數據庫能夠幫助院方打通這些孤島。”
展望未來,TigerGraph醫療保健行業實踐負責人Andrew Anderson認為圖數據庫必將在構建社群數字孿生、衡量并改善人口健康方面發揮更大的作用。他表示,“只有將醫療信息與社會層面的決定性健康影響因素進行對比,才能把握并解決護理服務供應、食品安全問題、人口統計與財務差異等難題。”
API
無論建模對象是患者個人還是醫療機構,數字孿生都需要使用大量原始數據素材,具體涵蓋電子健康記錄(EHR)、疾病登記、可穿戴設備等。Change Healthcare的Cautam Shah在采訪中指出,“無論配合哪種模型,API都有助于提升數字孿生效率、擴展使用范圍,進而改善醫療保健的成本與質量曲線。”
Shah還提到,“但多數情況下,醫療數據的來源與格式都太過分散。”這時候就需要API協助解決跨來源數據命名、組織與管理等層面的具體問題。再有,API還能減少數據的收集、關聯與準備時間,確保研究人員能夠專注于發掘數字孿生中的實際價值。
現代API平臺已經超越傳統數據傳輸管道,逐步發展成智能連接體系。例如,API能夠幫助我們構建起精準醫學中的數字孿生副本,及時捕捉反饋與數據并將結果傳遞回孿生副本,從而不斷更新數字孿生模型。
自然語言處理
醫療數據的來源多種多樣,繁雜的信息往往令我們無法準確把握患者的整體情況。而一旦將目標投向大規模人群,復雜度又將呈現指數級增長。John Snow Labs首席技術官David Talby表示,“數字孿生有助于消除信息過載,改善整體護理成效。今天,人類生成的數據比以往任何時候都多,根本不可能再額外花時間對數據進行整理。”所以當病人接受初級保健醫生的診療時,患者的個人情況、病史和用藥史就會被記錄在案。如果病情未能好轉、轉由專科醫生接診時,這些信息就能避免患者重復回答同樣的問題。
另外,臨床NLP軟件還能從圖像與無格式文本數據中提取信息,再將內容填寫到電子健康記錄當中。例如,Roche就使用NLP技術建立起臨床決策支持方案,而且起步就指向腫瘤學領域。NLP能夠從病理學和放射學報告中提取臨床事實,再把這些事實與非結構化的無格式文本信息結合起來,更好地支持醫生的臨床決策。
結構化數據往往包含大量細節,例如患者是否患有慢性病、是否服用過治療藥物或者有過醫療保險。但真正影響診治狀態的卻往往是其他更復雜的因素,例如疼痛程度、食欲和睡眠狀態等,這些只能從無格式文本中找尋。NLP的介入無疑給找尋開辟了通路。
生物模擬
生物模擬屬于計算機輔助數學模擬的范疇,能夠模擬服用一定劑量的藥物之后、人體會發生哪些變化。這是一種規模龐大的復雜模型,能夠模擬藥物在體內的運輸、代謝、排泄與起效機制,改善用藥安全與效果。所以這樣的模型越強,價值2000億美元的全球藥物研發行業就能獲得更大的發展驅動力。Certara公司CEO William Feehery博士在采訪中提到,“過去幾十年以來,生物模擬軟件平臺已經給藥物研發帶來過重大變革,預計這一趨勢將繼續保持下去。”
美國食品藥監局(FDA)與歐洲藥品管理局(EMA)先后發布過二十多份建模與模擬相關指導文件,希望摸清藥物配伍時的相互作用。過去十年以來,包含生物模擬內容的科學出版物數量也增加了兩倍。
目前最具前景的方向之一就是藥理生物模擬,即整合藥物與生理信息以建立數學建模框架。這類模型能夠預測各類未經測試的臨床結果,從而助力藥物研發。Certara等公司希望為患者個體建立數字孿生,從而把生物模擬的邊界繼續向外拓展。其中的基本原理就是重現每位患者的不同生理特征,探索這些特征如何影響藥物在體內的代謝動力表現、進而影響最終治療效果。
這些進展也讓我們能夠更好地針對不同患者亞群(例如老人與兒童)設定用藥劑量。Feehery表示,“我們的下階段目標,就是將虛擬孿生技術引入病患護理與臨床決策,為個性化醫療提供指導。”
真實世界證據
研究人員往往需要通過多種來源查詢數據,借此深入理解特定問題。而真實世界證據(RWE)平臺的定位就是匯總并審查原始數據,確保這些正確的數據可以反映出關鍵決策中的因果關系。2020年美國食品藥監局批準的所有新藥中,約有75%涉及某種形式的真實世界證據。這類數據可以來自電子健康記錄、保險索賠、產品與疾病登記、醫療設備與可穿戴設備等等。由于數據來源過多、彼此間又有著諸多互操作性限制,所以如何收集完整且高質量的數據一直是個重大難題。
Aetion公司高級副總裁兼副本分析總經理Khaled El Emam博士認為,“這些平臺能夠幫助客戶推斷出研究人員在源數據中發現因果關系的依據,由此提升合成數據或數字孿生的價值。如果沒有真實世界證據平臺提供適當的上下文支持,研究人員將很難從數字孿生中分析出直觀可見的模式。”
除了醫療保健之外,真實世界證據平臺在保障建筑物、車輛及其他產品安全等方面,也給高度強調安全性的行業帶來了福音。El Emam指出,“保障質量與可行性標準是真實世界證據流程中的重要組成部分。我們也應該將這些標準引入整個真實世界證據的生成過程,確保從數據源、數據處理再到適用場景定義,各個環節都穩定可靠。”
手術智能
手術智能是Theator公司提出的一個新概念,強調通過工具捕捉手術過程中的各項數據。Theator公司CEO兼聯合創始人Tamir Wolf博士解釋道,“其中的創新不僅體現在我們建立的數據結構與新本體上,更在于外科醫生在手術完成后能夠立即收到準確反饋。”
手術智能其實與Drishti、Tulip Interfaces等制造與物流企業已經實施的物理流程捕捉工具類似。在醫學領域,這些工具將幫助外科醫生在手術過程中進行操作校正,同時捕捉手術操作中的每一個微小細節。
Wolf表示,“醫院系統要想有效部署數字孿生,最關鍵的前提之一就是要能夠收集關于治療需求的高質量數據,這樣才能將目標與實效聯系起來、總結出值得推廣的最佳實踐。”
預測分析
數字孿生還有另一個極具前景的探索方向,就是幫助我們預測特定癥狀組合發生幾率,而后評估各種治療組合幫助患者恢復健康的可能性。預測分析工具可以與數字孿生技術協同,將患者的數字孿生與其他具有相似特征的以往病患進行匹配和比對。
Health Data Analytics Institute CEO Nassib Chamoun認為,“先進的統計技術有望幫助我們預估健康風險,幫助臨床醫生推斷哪些既有治療手段對這類患者更加有效,之后做出更明智的診療決策。”簡而言之,預測分析工具可以幫助預測不同治療方案的成本和臨床結果。
預測分析還能與數字孿生攜手提供不同的UI體驗,隨時交付各類洞見結論。例如,HDAI就為臨床醫生、患者和人口健康管理員開發出自定義視圖。臨床醫生的意見可以直接嵌入至電子健康記錄,管理員與患者自己的意見也可嵌入各類應用端。
可視化
醫學影像的顯影效果再逼真,摸不清其中表達的規律和趨勢還是沒有意義。例如,更深入的洞見結論能幫助醫生們更好地使用醫學影像,據此確定該選擇多大的植入物、具體植入到哪里。FEops公司CEO Matthieu De Beule表示,“說起來容易,但實際判斷其實非常困難。我們很難單憑想象來斷定醫療設備會怎樣與患者的身體進行交互。”
經過監管認證的器官醫學數字孿生能夠改善手術計劃與指導思路。例如,FEops公司開發出一種獲得審批的心臟模擬工具,能夠縮短手術操作與輻射下的暴露時間。多家主要心臟瓣膜制造商也打算利用這款工具開發下一代植入方案。
De Beule還提到,他們公司正在與GE、飛利浦和西門子等大型醫學成像公司合作。FEops HEARTguide產品使用AI技術對原始成像數據進行校準,確保其能夠反映患者獨特的解剖特征與生理構造,從而指導醫生在手術過程中為植入物選擇更恰當的位置。