醫(yī)療健康大數(shù)據(jù)關(guān)鍵問題及對(duì)策研究
1.醫(yī)療健康大數(shù)據(jù)應(yīng)用研究現(xiàn)狀和意義
在醫(yī)療衛(wèi)生領(lǐng)域,我國對(duì)大數(shù)據(jù)技術(shù)的應(yīng)用成熟度還不高。如何將傳統(tǒng)的醫(yī)療數(shù)據(jù)平滑過渡到大數(shù)據(jù)體系中,通過數(shù)據(jù)挖掘等手段對(duì)其進(jìn)行專業(yè)的分析來實(shí)現(xiàn)數(shù)據(jù)的“增值”,是當(dāng)下亟待解決的重要問題。能夠?yàn)榫珳?zhǔn)臨床診療、決策支持、疾病監(jiān)測(cè)預(yù)警與管理、公眾健康服務(wù)等領(lǐng)域提供有效的支撐,并能發(fā)揮區(qū)域衛(wèi)生信息平臺(tái)上匯聚采集的數(shù)據(jù)價(jià)值。
2.醫(yī)療健康大數(shù)據(jù)分析需要解決的關(guān)鍵問題
本文的研究目的就是探討如何解決大數(shù)據(jù)分析關(guān)鍵問題,主要包括:醫(yī)療健康數(shù)據(jù)類型和結(jié)構(gòu)復(fù)雜而多樣;從技術(shù)到業(yè)務(wù)有巨大的鴻溝:缺乏面向醫(yī)療健康領(lǐng)域的分析和挖掘算法庫、模型庫;缺少醫(yī)療健康知識(shí)庫支撐;大數(shù)據(jù)技術(shù)架構(gòu)及工具選擇所面臨的挑戰(zhàn):選擇一種架構(gòu)并構(gòu)建合適的大數(shù)據(jù)解決方案***挑戰(zhàn),因?yàn)樾枰紤]非常多的因素;技術(shù)本身的挑戰(zhàn):醫(yī)療健康語義知識(shí)庫構(gòu)建,非結(jié)構(gòu)數(shù)據(jù)的語義處理,傳統(tǒng)分析和挖掘技術(shù)的并行化,醫(yī)療健康標(biāo)準(zhǔn)化問題和數(shù)據(jù)質(zhì)量問題;如何研究基于大數(shù)據(jù)的應(yīng)用。
3. 醫(yī)療健康大數(shù)據(jù)分析對(duì)策
本文結(jié)合在上海市衛(wèi)計(jì)委醫(yī)療大數(shù)據(jù)分析案例給出醫(yī)療健康大數(shù)據(jù)分析對(duì)策。
3.1 確定醫(yī)療健康大數(shù)據(jù)的業(yè)務(wù)研究主題
結(jié)合上海市衛(wèi)計(jì)委目前信息化現(xiàn)狀,以及采集的數(shù)據(jù)范圍,確定醫(yī)療健康大數(shù)據(jù)的業(yè)務(wù)研究主題,包括:個(gè)性化健康管理:健康評(píng)估預(yù)警、健康自我管理、康復(fù)跟蹤、就醫(yī)輔助、健康處方制定、健康異常提醒;醫(yī)療衛(wèi)生服務(wù):醫(yī)療臨床輔助、臨床成本效益、智能診療方案分析、療效評(píng)估、臨床質(zhì)量分析、醫(yī)療數(shù)據(jù)透明度;精準(zhǔn)化衛(wèi)生管理:醫(yī)療資源分配、管理績(jī)效分析、公眾健康監(jiān)測(cè)、病人疾病經(jīng)濟(jì)負(fù)擔(dān)、醫(yī)療服務(wù)定價(jià)、醫(yī)保控費(fèi);醫(yī)療科研:比較效果研究、疾病模式分析、合理用藥分析、傳染病預(yù)警、慢性病發(fā)病趨勢(shì);企業(yè)大數(shù)據(jù)利用:新藥研究、藥物不良反應(yīng)、醫(yī)療保險(xiǎn)定價(jià)、健康管理服務(wù)。
3.2 醫(yī)療健康大數(shù)據(jù)技術(shù)架構(gòu)
醫(yī)療健康大數(shù)據(jù)技術(shù)架構(gòu)解決方案提供基于大數(shù)據(jù)的醫(yī)療健康智能服務(wù)。通過聚合數(shù)據(jù)、重構(gòu)數(shù)據(jù)、挖掘數(shù)據(jù)價(jià)值,實(shí)現(xiàn)醫(yī)療健康領(lǐng)域的智能化服務(wù)。
3.3 醫(yī)療健康大數(shù)據(jù)的數(shù)據(jù)分類
醫(yī)療健康大數(shù)據(jù)根據(jù)數(shù)據(jù)的采集來源和業(yè)務(wù)分類可以分為:醫(yī)院醫(yī)療大數(shù)據(jù):包括各種門急診記錄、住院記錄、影像記錄、實(shí)驗(yàn)室記錄、用藥記錄、手術(shù)記錄、隨訪記錄和醫(yī)保數(shù)據(jù)等;區(qū)域服務(wù)平臺(tái)醫(yī)療健康大數(shù)據(jù);疾病監(jiān)測(cè)大數(shù)據(jù):基于大量人群的醫(yī)學(xué)研究或者疾病監(jiān)測(cè)的大數(shù)據(jù);自我量化大數(shù)據(jù):基于移動(dòng)物聯(lián)網(wǎng)的個(gè)人身體體征和活動(dòng)的自我量化數(shù)據(jù),包含血壓、心跳、血糖、呼吸、睡眠、體育鍛煉等信息;互聯(lián)網(wǎng)及社交媒體數(shù)據(jù):是指互聯(lián)網(wǎng)上與醫(yī)學(xué)相關(guān)的各種數(shù)據(jù);生物大數(shù)據(jù):主要是關(guān)于生物標(biāo)本和基因測(cè)序的信息,直接關(guān)系到臨床的個(gè)性化診療及精準(zhǔn)醫(yī)療;保險(xiǎn)數(shù)據(jù):醫(yī)保、新農(nóng)合、健康保險(xiǎn)數(shù)據(jù)等;外部數(shù)據(jù):包括環(huán)境、氣象、地理數(shù)據(jù)等。
3.4 醫(yī)療健康大數(shù)據(jù)標(biāo)準(zhǔn)制定
上海市衛(wèi)計(jì)委醫(yī)療衛(wèi)生大數(shù)據(jù)平臺(tái)標(biāo)準(zhǔn)體系將在相關(guān)國際標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)、省市的區(qū)域衛(wèi)生信息化建設(shè)中已發(fā)布的數(shù)據(jù)元、數(shù)據(jù)元值域代碼、醫(yī)療衛(wèi)生術(shù)語、共享文檔規(guī)范等標(biāo)準(zhǔn)基礎(chǔ)上,結(jié)合業(yè)務(wù)特性建立業(yè)務(wù)的關(guān)聯(lián)性,建立業(yè)務(wù)邏輯模型,并落實(shí)到醫(yī)療健康大數(shù)據(jù)采集的相關(guān)數(shù)據(jù)接口中。從而建立醫(yī)療衛(wèi)生大數(shù)據(jù)標(biāo)準(zhǔn)體系,包括醫(yī)療衛(wèi)生大數(shù)據(jù)服務(wù)數(shù)據(jù)規(guī)范、醫(yī)療衛(wèi)生大數(shù)據(jù)服務(wù)接入管理規(guī)范、醫(yī)療衛(wèi)生大數(shù)據(jù)服務(wù)開放管理規(guī)范和醫(yī)療衛(wèi)生大數(shù)據(jù)服務(wù)安全隱私規(guī)范。
3.5 醫(yī)療健康大數(shù)據(jù)治理策略
數(shù)據(jù)質(zhì)量依賴于數(shù)據(jù)的應(yīng)用,如何用大數(shù)據(jù)思維、新理念、新技術(shù)、新方法對(duì)采集到的數(shù)據(jù)進(jìn)行梳理、整體分類。醫(yī)療健康數(shù)據(jù)的整合、存儲(chǔ)、挖掘和探索的基礎(chǔ)是數(shù)據(jù)治理。數(shù)據(jù)質(zhì)量問題已經(jīng)成為限制醫(yī)療衛(wèi)生信息系統(tǒng)效能發(fā)揮的瓶頸和短板。數(shù)據(jù)質(zhì)量涉及許多因素,包括準(zhǔn)確性、完整性、一致性、時(shí)效性、可信性和可解釋性。為了提高數(shù)據(jù)時(shí)效性,任何數(shù)據(jù)都在醫(yī)務(wù)人員的實(shí)際工作過程中在其工作平臺(tái)軟件上錄入,業(yè)務(wù)軟件上采集的數(shù)據(jù)按照一定的規(guī)則和標(biāo)準(zhǔn)逐級(jí)匯總到衛(wèi)計(jì)委/局的數(shù)據(jù)中心。
3.6 醫(yī)療健康大數(shù)據(jù)挖掘分析關(guān)鍵技術(shù)
醫(yī)療健康大數(shù)據(jù)挖掘分析的技術(shù)包括:計(jì)算、互聯(lián)和存儲(chǔ);數(shù)據(jù)處理和管理;數(shù)據(jù)分析;可視化;應(yīng)用和服務(wù)。
4.上海市衛(wèi)計(jì)委糖尿病用藥推薦案例分析
確定大數(shù)據(jù)分析主題:研究影響醫(yī)生給糖尿病患者用藥的相關(guān)因素;數(shù)據(jù)預(yù)處理與特征提取:根據(jù)診斷編碼ICD-10篩選糖尿病人診療記錄,共472 460診療記錄,涉及516 340個(gè)病人;根據(jù)初篩的特征變量進(jìn)行數(shù)據(jù)質(zhì)量分析,判斷其實(shí)際可用性。通過兩輪篩選判別,最終選取可用變量38 項(xiàng),最終形成糖尿病病人特征大表,共260萬條記錄;目標(biāo)的模型構(gòu)建與評(píng)估:將300多種藥品,按目錄通用名分為26類,利用隨機(jī)森林樹算法的多分類挖掘方法,給出28種藥品的使用概率,基于概率大小推薦Top藥品組合;最終優(yōu)化結(jié)果:模型準(zhǔn)確度為0.64,模型的精度為0.25。
5 結(jié)論
本文結(jié)合在上海市衛(wèi)計(jì)委醫(yī)療健康大數(shù)據(jù)分析的項(xiàng)目案例,提出醫(yī)療健康大數(shù)據(jù)分析的關(guān)鍵問題,探索和總結(jié)了解決這些關(guān)鍵問題的對(duì)策。研究醫(yī)療健康大數(shù)據(jù)分析的方法、模型和算法,結(jié)合臨床、科研、藥品、公共衛(wèi)生等領(lǐng)域的業(yè)務(wù)需求,能夠充分挖掘區(qū)域衛(wèi)生信息平臺(tái)中積累的醫(yī)療健康大數(shù)據(jù)的應(yīng)用價(jià)值。