人工智能公平技術對于挽救生命具有重大意義
弗吉尼亞理工大學計算機科學教授Daphne Yao希望提高機器學習模型在醫療應用中的預測精度。不準確的預測可能會導致危及生命的后果。這些預測誤差可能會導致錯誤計算病人在急診室就診時死亡或癌癥存活的可能性。
她的研究結果最近發表在《醫學通訊》雜志上,該雜志致力于發表高質量的研究、評論和論文,涵蓋所有臨床、轉化和公共衛生研究領域。
Yao說,許多臨床數據集是不平衡的,因為它們被多數群體樣本所主導。在典型的適用于所有人的一臺機器學習模型范式中,種族和年齡差異很可能存在,但可能被忽略。
Yao和她的研究團隊與Charles B. Nemeroff合作,Nemeroff是美國國家醫學院的成員,也是德克薩斯大學奧斯汀分校戴爾醫學院精神病學和行為科學系的教授,研究訓練數據中的偏差如何影響預測結果,特別是對代表性不足的患者的影響,如年輕患者或有色人種患者。
Nemeroff說:“我非常高興能與Yao合作,她是先進機器學習領域的世界領導者。”“她和我討論了一個概念,即機器學習的新進展可以應用于臨床研究人員經常遇到的一個非常重要的問題,即通常參加臨床試驗的少數族裔人數相對較少。”
這導致醫療結論主要是針對多數群體(歐洲裔白人患者)得出的,這可能不適用于少數族裔群體。
Nemeroff稱:“這份新報告提供了一種方法來提高對少數群體的預測準確性。”“顯然,這些發現對改善少數民族患者的臨床護理具有非常重要的意義。”
Yao的弗吉尼亞理工大學團隊由計算機科學系的博士生Sharmin Afrose和Wenjia Song以及化學工程系的Chang Lu,Fred W. Bull教授組成。為了進行研究,她們在兩個數據集上對四種不同的預后任務進行了實驗,使用了一種新的雙優先級(DP)偏差校正方法,為特定的種族或年齡組訓練定制模型。
“我們的工作展示了一種新的人工智能公平技術,可以糾正預測錯誤,”四年級博士生Song說,她的研究領域包括數字健康和網絡安全中的機器學習。“我們的DP方法提高了少數民族班級的表現高達38%,并顯著減少了不同人口統計群體之間的預測差異,比其他抽樣方法好88%。”
監測、流行病學和最終結果數據集被Song用于乳腺癌和肺癌生存率的任務,而五年級博士生Afrose則使用來自波士頓Beth Israel Deaconess醫療中心的數據集進行住院死亡率預測和失代償預測任務。
“我們很高興找到了減少偏見的解決方案,”Afrose說,她的研究重點包括醫療保健和軟件安全中的機器學習。“我們的DP偏差校正技術將減少對少數群體潛在的威脅生命的預測錯誤。”
隨著這些發現的發表和公開訪問,該團隊渴望與其他研究人員合作,在他們自己的臨床數據分析中使用這些方法。
Song說:“我們的方法很容易部署在各種機器學習模型上,可以幫助提高任何具有表征偏差的預后任務的性能。”