谷歌研發(fā)AI系統(tǒng),可使異常病例檢測周轉(zhuǎn)時間縮短28%
近日,谷歌團隊的又一重大研究成果登上 Nature 子刊。該研究成果主要揭示了正常和異常胸片深度學習的區(qū)別,以及對結(jié)核病和 COVID-19 兩種致病因子不明顯疾病的概括。
值得關注的是,在人工智能系統(tǒng)優(yōu)先處理異常病例的模擬工作流程中,異常病例的周轉(zhuǎn)時間可以縮短 28%,這關乎人工智能評估系統(tǒng)是否可以安全地用于以前未見異常標記案例。
9 月 1 日,相關論文以《用于正常和異常胸片深度學習的區(qū)別以及對結(jié)核病和 COVID-19兩種看不見疾病的概括》(Deep learning for distinguishing normal versus abnormal chest radiographs and generalization to two unseen diseases tuberculosis and COVID-19)為題發(fā)表在 Scientific Reports 上。
圖|相關論文(來源:Scientific Reports)
由谷歌健康團隊成員丹尼爾·謝(Daniel Tse)、博軒·卡梅倫·陳(音譯)(Po-Hsuan Cameron Chen)和什拉維亞·謝蒂(Shravya Shetty)擔任共同通訊作者。
胸腔放射成像作為使用頻率較高的胸腔臨床成像模式,在指導心胸疾病管理方面具有至關重要的作用。一直以來,檢測特定的胸腔放射異常(Chest Radiography,CXR)研究是多個人工智能系統(tǒng)的主要焦點。
圖|胸部X放射(來源:YouTube 視頻截圖)
然而,由于 CXR 異常范圍十分廣泛,每個人工智能系統(tǒng)都需檢測一個或多個預先指定的條件。因此,試圖通過制備數(shù)個單獨的人工智能系統(tǒng),檢測每個有可能出現(xiàn)的情況與實際情況不相匹配。
面對這一挑戰(zhàn),該團隊對人工智能系統(tǒng)進行了開發(fā)與深度評估,將 CXR 射線分為正常和異常兩種。為了對 CXR 系統(tǒng)進行調(diào)整,該團隊開發(fā)了一個深度學習系統(tǒng) (Deep Learning System,DLS),在印度五個城市的五家醫(yī)院對約 2.48 萬名患者做了數(shù)據(jù)集識別,他們還對印度、中國和美國的 6 個國際數(shù)據(jù)集做了 CXR 系統(tǒng)通用性評估。
圖|DLS 研究設計示意圖(來源:Scientific Reports)
在這些數(shù)據(jù)集中,有四個側(cè)重于 AI 未受過檢測培訓的疾病,另外四個分別是兩個結(jié)核病數(shù)據(jù)集和兩個 2019 年冠狀病毒疾病數(shù)據(jù)集。該團隊的研究成果表明,AI 系統(tǒng)可以使用包含各種胸腔放射異常的大型數(shù)據(jù)集進行培訓,這些異常情況可以被分為新患者和癥狀不明的疾病人群。為了促進 CXR AI 模型的持續(xù)開發(fā),該團隊發(fā)布了他們收集的,用于公開提供數(shù)據(jù)集的標簽。
該研究成果表明,可信賴的 AI 系統(tǒng)可區(qū)分正 CXR 的正常或異常狀態(tài),對于患者的日常鍛煉和管理具有一定的益處。
首先,在放射科醫(yī)生較大的審查情況下,AI 算法可用于識別不太可能患病的病例,幫助醫(yī)療保健專業(yè)人員能夠快速地排除某些差異診斷,將更多的工作時間用于其他方向的疾病診斷。然后,將可能患病案例統(tǒng)一劃分到一組,以便進行優(yōu)先審查,進而縮短檢測周轉(zhuǎn)的時間。
其次,在大規(guī)模疾病爆發(fā)期間,當臨床需求超過放射科醫(yī)生可用性的環(huán)境中,這種人工智能系統(tǒng)可能被用作非放射科醫(yī)生的前線護理點工具。更重要的是,需要對在開發(fā)過程中未遇到的異常 CXR 進行人工智能評估,以驗證其對新疾病或新疾病表現(xiàn)的穩(wěn)健性。
谷歌研究人員在論文中指出,在某些情況下,他們的深度學習模型在放射檢測方面具有較大的優(yōu)勢,可以較大地提高放射科科醫(yī)生工作效率。
該團隊研究成員表示:“不論在相對健康的門診實踐,還是在異常繁忙的住院或門診環(huán)境中,DLS 系統(tǒng)都有助于將異常的 CXR 置于優(yōu)先級,以便快速地向放射科醫(yī)生解釋。
在這項工作中,該團隊在一定的條件下,對這些有助于驗證 DLS 的數(shù)據(jù)性能進行了評估,并使用相同的數(shù)據(jù)進行其他研究的基準測試。
為了更好地了解 DLS 在逆轉(zhuǎn)錄聚合酶鏈式反應 (Reverse Transcription-Polymerase Chain Reaction ,RT-PCR)靈敏度方面的潛在影響,該團隊對 COVID-19 案例進行了更加詳細的分析。該案例在初始測試中具有 “假陰性”RT-PCR 測試結(jié)果,定義為陰性 RT-PCR 測試,然后在五天內(nèi)檢測為陽性,在 21 個此類案例中,DLS 的靈敏度達到 95.2%。
圖|真陽性和假陽性的樣本 CXR(來源:Scientific Reports)
為了解他們可發(fā)的 DLS 是具體如何幫助練習放射科醫(yī)生的,他們調(diào)查了兩個基于 DLS 的模擬工作流程。假設放射科醫(yī)生尚未審查 DLS 陰性病例,并認為這些案例被解釋為 “正常”,基于評估目的,其有效的即時表現(xiàn)令人滿意。
放射科醫(yī)生和按照順序 DLS 放射科醫(yī)生設置之間的性能差異很小,但 DS-1 和 CXR-14 的有效“緊急”案例量減少了 25%-30%,結(jié)核病數(shù)據(jù)集減少了約 40%,COVID-19 數(shù)據(jù)集減少了約 5-10%。
圖|DLS 放射性圖譜(來源:Scientific Reports)
該團隊開發(fā)的 DLS 可以解釋 CXR 是否為異常,并用六個數(shù)據(jù)集進一步驗證了它的適應性,其中包含兩個廣泛的臨床數(shù)據(jù)集,兩個未見疾病的數(shù)據(jù)集以及兩個帶有第二種未發(fā)現(xiàn)疾病的數(shù)據(jù)集。
總之,該團隊已經(jīng)開發(fā)并評估了一個與臨床相關的,可用于胸部X射線檢測的人工智能模型,并評估了其在 6 個不同數(shù)據(jù)集上的適用性。該團隊希望,其研究成果中的性能分析以及公開可用的 CXR-14 圖像的專屬標簽發(fā)布,可以促進臨床 CXR 人工智能模型的持續(xù)發(fā)展。