AI模型幫助研究人員提高癌癥檢測精度
Madhu Nair博士和Asha Das博士即將實現一項重大突破,即使用人工智能(AI)模型在患者組織樣本的掃描圖像中檢測乳腺癌癥細胞。
這兩位印度研究人員曾面臨著一個巨大的挑戰:他們花了幾個月的時間來訓練他們的人工智能模型,以準確識別癌癥細胞。Das和她的團隊經常花數周時間審查成堆的高分辨率巨型像素圖像,逐個圖像標記癌區。
該團隊需要一種能夠準確快速地掃描這些圖像的解決方案,并且無需人工監督。
2022年,印度科欽科技大學人工智能與計算機視覺實驗室的研究人員Das博士和Nair博士與英特爾工程、銷售和營銷團隊合作,使用英特爾至強可擴展處理器和英特爾優化TensorFlow實現了一種新的解決方案,一個依賴英特爾CPU加速功能的軟件套件。
今天,發現癌癥的早期癥狀在很大程度上依賴于放射科醫生和治療醫生的專業知識,他們手動掃描組織病理學結果。但是,根據美國國家癌癥研究所(National cancer Institute)的數據,僅僅依靠人眼也有其負面影響,大約20%的乳腺癌癥癥狀會被忽視。
這就是人工智能可以提供幫助的地方。由于計算技術的突破,越來越多的醫院開始接受使用人工智能來發現醫生可能會錯過的東西的思路。去年12月,英特爾和賓夕法尼亞醫學院宣布,他們已經幫助研究人員將癌癥腦瘤的檢測提高了33%。
Das解釋了她的團隊是如何首先采用基于GPU的解決方案來增強他們的深度學習模型的。只有一個問題:他們基于GPU的系統經常會失敗,因為處理大圖像所需的計算量遠遠超過了系統的設計限制,導致莫名其妙的停機和令人沮喪的重啟。
Nair在描述這些挑戰時寫道:“我們的模型對計算要求很高,我們使用GPU訓練模型的嘗試失敗了。”“我們花了幾天時間來執行,發現很難完成更高分辨率圖像的訓練。這促使我們尋找更好的計算設備。”
2022年,Nair發現了英特爾的機會。幾個月后,他們部署了四臺服務器,作為一個單一的計算集群運行,沒有任何深度學習加速器。服務器和存儲器使用高速以太網連接。在軟件方面,聯合團隊轉向了英特爾針對TensorFlow的優化軟件套件,通過利用英特爾CPU的加速功能來提高TensorFlow性能。
研究結果正是研究人員所希望的,還有一個令人欣慰的驚喜:他們的模型不僅能標記癌細胞,還能區分不同級別的癌癥。它非常準確:該解決方案的準確率為98%,比其他模型高出約10個百分點。隨著時間的推移和在更多的數據集上訓練他們的模型,研究人員預計準確率會逐漸上升。
Nair說:“英特爾的體系結構令人驚嘆。“我們能夠在幾個小時內完成培訓。因為服務器有192GB的內存,超過了顯卡上的40GB或80GB,所以我們能夠使用高分辨率圖像,并將整個模型放入內存中。英特爾還幫助我們改進了模型,并與我們分享了優化,使其發揮作用。這就是我們能夠成功的原因。”
考慮到準確度數據是用比其他模型所需的訓練數據少得多的數據實現的,這一結果更令人印象深刻,大大縮短了周轉時間。她補充道,“值得注意的是,我們只注釋了20%的數據,就實現了98%的準確率。這真的很令人興奮。”
該技術的下一步正在等待,因為該團隊獲得了專利,并找到了愿意打破習慣于人類接觸的市場空間的商業合作伙伴。另外還有準確性的問題,雖然98%的準確率可能看起來很高,但對于現實世界的患者來說,它還不夠精確。
現在Das和Nair已經證明了他們的模型能夠可靠地檢測到乳腺癌癥細胞,他們正在研究對腦動脈瘤應用類似的方法,并從內窺鏡檢查中對息肉進行分類。Das說:“我們還計劃擴展這個模型來檢測多器官癌癥。”她補充說,她現在正致力于擴展解決方案來分析淋巴結圖像,因為乳腺癌癥經常會擴散到腋下相鄰的淋巴結。