醫療保健領域AI數據治理的新內容和變化
GenAI正在幫助醫療機構提高生產力和推進臨床護理,但其可靠性完全取決于訓練所用的數據。這使得醫療數據治理變得愈發重要。
AWS和《哈佛商業評論》的一項新調查顯示,多個行業的首席數據官都擔心他們的數據資產無法勝任這項任務。根據該調查的新聞稿,52%的受訪者認為其組織對GenAI的準備“不足”,39%的受訪者表示數據問題是阻礙他們有效擴展AI應用的首要挑戰。
然而,AWS的企業戰略師托馬斯·戈登表示,醫療行業的監管框架使其在發展AI方面具有獨特優勢。“數據治理從根本上說是確保患者安全的基礎,”曾擔任Foundation Medicine首席信息官的戈登說道,“醫療機構已經需要對數據進行清理和控制。因此,在很多方面,它們比其他行業更有條件發展AI。”
為何AI使醫療數據治理更加復雜?
數據治理是指確保數據高質量、易于訪問、安全且可信的政策和標準。跟蹤和維護AI支持的技術所需的大量數據,在幾個關鍵方面使醫療數據治理更具挑戰性。
常見挑戰包括:
保持數據集更新
醫療數據不斷變化,AI訓練模型必須反映這些變化以確保準確性。“如果你不是每天或每周更新模型,你就會錯過世界上和患者身上發生的事情。”戈登說道。
消除偏見
數據可能包含與性別、種族和社會經濟地位等因素相關的偏見。Quest Software的首席現場技術專家蘇珊·萊恩表示,數據團隊必須建立系統來識別并從訓練數據中消除這些偏見。“當這些數據被輸入AI用于診斷和治療建議時,數據問題只會被放大。”她警告說。
明確責任和問責
如果AI驅動的決策導致不良結果,那么責任應由開發者、用戶還是系統本身承擔?“如果你對數據的處理情況缺乏透明度,那么你就無法知道問題的真正來源或需要修復的地方。”萊恩說道。
AI和數據治理有何益處?
穩健的數據治理框架確保AI模型接收高質量的信息,從而降低風險。“數據治理就像給AI套上一個玻璃盒子,”萊恩說道,“它提供了對AI模型輸入數據的透明度,以及誰接觸過這些數據。”
同時,AI本身也可以改善數據管理。它可以用于政策執行和安全模式分析。例如,AI可以監控和驗證敏感患者數據是否被正確訪問和處理。
聊天機器人可以通過幫助分析師更高效地排序和解釋大型數據集中的信息,來增強終端用戶體驗。
此外,機器學習工具可以幫助醫療機構利用更大量的數據涌入。AI自動處理并從其收集的數據中學習,這使系統能夠持續改進。
組織如何對AI數據治理設定現實期望?
戈登表示,一個常見的挑戰是領導者認為他們需要先振興組織的所有數據集,然后才能從AI工具中生成價值。相反,他鼓勵他們調整期望,并從小目標開始:“識別一個商業機會,并專注于治理和清理解決該特定問題所需的數據。”
明確定義組織的價值觀并確保員工理解這些價值觀至關重要。這提供了必要的指南,以便當數據異常發生時,員工能夠按照公司的期望正確識別并修復它。“AI模型會有偏見,而修正將取決于個人做出價值判斷。”萊恩說道。
她補充說,醫療系統需要記住AI并不完美。人為干預至關重要,尤其是在確定數據異常發生的原因時。“如果我是醫生,知道有一個數據治理團隊在幕后驗證數據的合理性,我會感到更安心。”萊恩說道。
誰應主導AI數據治理工作?
首席數據官通常主導治理工作,并得到數據質量分析師和架構師的支持。現在,還使用提示專家來更好地訓練AI訓練模型。
萊恩強調,在開始AI和數據治理工作時,數據管理專業人員應該幫助引領方向:“這些人是了解數據如何移動和變化的人。我認為依靠他們的專業知識是組織正確實施的關鍵。”
戈登補充說,在建立醫療AI項目時,應該有一個多元化的團隊參與制定管理該技術的政策和程序。這包括IT和數據團隊、醫療專業人員以及來自法律、營銷和人力資源部門的人員。
“你需要讓參與構建和使用AI的每個人都理解它并保持警惕,”戈登說道,并指出所有團隊成員都有責任監控AI以發現不一致之處。“這不僅是一個IT問題,而且是每個人的問題。”