人工智能如何助力惡性腦瘤的發展預測
譯文【51CTO.com快譯】隨著人工智能的發展, 與人們日常生活息息相關的許多領域都受到人工智能的影響。其中,醫療領域作為人們關注的重點,很早便引入了機器學習來輔助醫生進行治療。
例如人們可以利用機器學習來自動識別 X 光片中的影像是否有骨折,或者判斷醫療影像中是否存在腫瘤或者癌癥。這些相關的研究有的歷史非常悠久,有長達10年甚至更久的研究時間。人工智能在醫療行業的商業化落地實踐,最近受到了風投行業的追捧,成為了最為熱門的投資領域之一。
圖1. 人工智能醫療公司圖譜
MICCAI 是醫學圖像處理領域的權威會議。2016 年, Han Zhang 等3位研究者在 MICCAI 上發表了題為 Outcome Prediction for Patient with High-Grade Gliomas from Brain Functional and Structural Networks 的論文,講述了他們如何利用圖像處理和機器學習的技術預測腦瘤發展趨勢。下面我們來看一下他們的方法:
45% 的腦瘤都可以歸類為大腦膠質瘤,論文是對高惡性程度大腦膠質瘤(HGG)發展趨勢的預測。作者聲稱本研究是研究界首次通過分析大腦神經連接情況進行腦瘤預測。HGG 發展預測由3個部分組成:圖像處理、特征選擇、分類,具體步驟見下圖:
圖2. 腦瘤預測系統架構圖
訓練數據
作者選取了68名病人作為研究對象,其中34 名病人在 650 天內病故,被當作負樣本(bad)。另外 34 名病人存活日期超過了 650 天,被當作正樣本(good)。訓練數據來源為 rs-fMRI 數據和 DTI 數據。
圖像處理
作者利用了 SPM8 和DPARSF 軟件處理 rs-fMRI 數據來構建功能性大腦網絡模型,同時采用 FSL 和 PANDA 軟件處理 DTI 數據來結構性大腦網絡模型。
網絡構建
針對結構性大腦網絡,作者利用 AAL 將大腦分割成 116 個區域,并構建圖論模型。其中每個區域是圖中的一個結點,有神經纖維連接的區域之間產生一條邊,邊的權重與纖維的數量成正比,與兩個區域的皮質表面積之和成反比。作者對這 116 個區域中的每個區域抽取了 BOLD 時間序列,并計算序列和序列之間的相關性作為節點之間的權重。
特征抽取
作者計算了構建的大腦網絡中的如下特征作為機器學習模型的輸入數據:網絡中節點的度、 網絡的聚類系數和最短路徑長度、網絡效度和網絡中心度。還加入了13個額外特征,包括性別、年齡、腫瘤大小等。每個病人的特征總數為 2797 個。因為特征的維數較高,會產生過擬合問題,作者采用如下3個步驟進行特征抽取:
1. 利用 t-檢驗 挑選出最能區分正負樣例的特征
2. 利用 RELIEF 算法給剩余的特征進行排序并賦予權重
3. 使用序列后向法進行特征選取。然后利用 SVM 在特征子集上進行預測。準確度最高的特征子集被用來作為分類步驟的特征。
實驗結果
當值采用臨床特征進行預測時,正確率只有 63.2%;當采用全部特征進行預測時,正確率為 75%。具體實驗結果參見下表:
圖3. 不同人工智能算法在腦瘤預測問題上的效果
人工智能醫療領域方興未艾,目前風頭正勁。人工智能醫療涉及到圖像處理,機器學習等相關技術,歷史淵源流長。近年來備受風投青睞的人工智能醫療究竟是新瓶裝舊酒,還是下一個風口,讓我們拭目以待。
原文標題:Outcome Prediction for Patient with High-Grade Gliomas from Brain Functional and Structural Networks,作者:Luyan Liu,Han Zhang,Islem Rekik,Xiaobo Chen,Qian Wang,Dinggang Shen
汪昊,恒昌利通大數據部負責人,美國猶他大學碩士,在百度,新浪,網易,豆瓣等公司有多年的研發和技術管理經驗,擅長機器學習,大數據,推薦系統,社交網絡分析,計算機圖形學,可視化等技術。在 TVCG 和 ASONAM 等國際會議和期刊發表論文 5 篇。本科畢業論文獲國際會議 IEEE SMI 2008 最佳論文獎。
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】