放射科醫生再臨危機!國外五大機構聯合發布「胸部X光」最新基準
胸部X光(CXR)檢查是一種廣泛應用于各種疾病的篩查、診斷檢查的臨床成像方式。
臨床診斷中,不僅包括常見的疾病類型,往往還會描述相應嚴重程度和不確定性,目前的醫學圖像數據庫往往滿足于預測疾病類型,而忽視了具有重大臨床意義的后者。
最近,德州州立阿靈頓分校、NIH、理化學研究所、東京大學以及日本國立癌癥研究中心的研究人員從臨床角度出發,提出了提出一個包含疾病嚴重程度和不確定性的全新數據集并提出了一種用于CXR疾病分類的解剖結構感知的多關系圖學習方法。
論文地址:https://arxiv.org/abs/2309.03331
項目主頁:https://github.com/MengRes/Uncertain-Label.git
數據集:https://physionet.org/content/cad-chest/1.0/
這篇論文的主要貢獻有兩點:
1. 提出一個包含疾病嚴重程度和不確定性的數據集。
2. 提出了一種使用醫學知識的多關系圖學習方法用于CXR疾病分類。
全新數據集
診斷疾病的嚴重程度在臨床診斷中至關重要,超越了疾病類別存在或不存在的二元分類,在MIMIC-CXR數據集中(最大的胸片數據集之一)以及隨附的放射學報告,疾病嚴重程度的描述(例如圖1中的「small pleural effusion」或「mild cardiomegaly」)很常見。
圖1:放射學報告中關于疾病不確定性和嚴重程度的描述(疾病用紅色字體標出,嚴重程度用綠色高亮,不確定性用藍色高亮)
據了解,之前沒有研究解決報告的疾病嚴重程度的問題。
其次,由于胸片的基本復雜性和難度,對醫生的疾病不確定性進行建模非常重要。放射科醫生經常在臨床記錄中使用「可能」、「不排除」和「也許」等術語在臨床記錄中表明不同程度的不確定性。
大多數先前的研究將這種不確定性視為負面類別,這可能會誤導臨床決策。
研究人員使用了基于規則的提取方法從放射學報告中提取疾病的名稱,嚴重程度和不確定性信息。
對于疾病名稱,研究人員列出每一種疾病可能使用的表述,對于疾病嚴重程度,并列出了表示嚴重程度的詞語,并將嚴重程度量化為輕度(mild),中度(moderate)和嚴重(sever)三個等級,如表1所示。
對于疾病的不確定性,研究人員與醫生合作,制定了不同的不確定性詞語與標簽值的映射,將不同的嚴重程度對應于不同的標簽值,對疾病的描述越肯定,標簽值越高,如表2所示。
表1:表示疾病嚴重程度的詞語
表2:表示疾病不確定性的詞語
研究人員邀請經驗豐富的醫生評估提取的標簽的準確性,向醫生提供了500份隨機選擇的放射學報告及其相應提取的疾病,嚴重程度和不確定性標簽。
根據醫生的反饋統計了標簽的準確性,如表3所示。
表3:提取的標簽的準確性評估
方法
基于上述提取的標簽上使用圖網絡對疾病分類。
根據醫生提供的醫學知識,構建出了三種圖網絡關系,分別為spatial graph(表示解剖學結構之間的關系),semantic graph(疾病之間的關系)和implicit graph(表示潛在的關系)。
模型結構如圖2所示,具體介紹情參見論文。
圖2:方法的網絡結構
實驗
研究人員在提取的標簽上進行實驗并和其他方法比較,結果如表4所示。
表4:與其他方法的比較結果
研究人員使用二元標簽和不確定標簽來訓練模型,記為Ours(0-1)和Ours(Uncertain)。
為了更深入地研究方法的性能,文中還進行了消融研究。每個實驗都針對具有二元標簽和不確定標簽的spatial graph、semantic graph和implicit graph進行單獨訓練。
作者將疾病感興趣區域與在ResNet-50模型上使用Grad-CAM生成結果進行比較。從報告中提取異常區域如下圖所示。可以發現,放射學報告顯示雙側下肺(左下肺和右下肺)出現混濁。
此外,右肺的混濁可能代表肺炎。ResNet-50模型在不透明和肺炎的情況下重點關注右下肺、右中肺和心臟區域。
從報告中可以發現心臟區域沒有異常,而左下肺的疾病被遺漏,使得Grad-CAM結果不太準確。研究人員提出的模型同時關注左下肺和右下肺,并且比ResNet-50方法表現更好。
圖4:報告中的異常描述以紅色突出顯示,從文本中提取的異常和位置在報告下方提供。為每個異常提供兩張圖像以進行比較。(a)和(c)是ResNet-50模型中Grad-CAM獲得的異常感興趣區域。(b)和(d)是通過研究人員的方法獲得的感興趣的節點。在結果中,每個邊界框對應一個解剖區域的節點,紅色邊界框是關注度最高的節點,黃色邊界框對應與紅色邊界框密切相關的節點。綠色箭頭表示節點之間的連接。
結論
在這項研究中,作者提出CXR疾病診斷在臨床中存在的疾病嚴重性和不確定性描述的問題。
針對此問題作者使用基于規則的方法從放射學報告中提取包含疾病嚴重程度和不確定性的標簽。
在該數據集上,作者使用基于醫學知識的圖神經網絡來預測疾病的嚴重程度和不確定性。