成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

谷歌開源FHIR標準協議緩沖工具,利用機器學習預測醫療事件

新聞 機器學習
谷歌在arXiv上發表的一篇論文《 Scalable and accurate deep learning for electronic health records》( Alvin Rajkomar et al. )。文中他們提出基于快速醫療保健互操作性資源(FHIR)格式的患者EHR原始記錄表示,利用深度學習的方法,準確預測了多起醫療事件的發生。

 在上月26日,谷歌在arXiv上發表的一篇論文《 Scalable and accurate deep learning for electronic health records》( Alvin Rajkomar et al. )。文中他們提出基于快速醫療保健互操作性資源(FHIR)格式的患者EHR原始記錄表示,利用深度學習的方法,準確預測了多起醫療事件的發生。

論文摘要如下:

使用電子健康記錄(EHR)數據的預測建模預計將推動個人化醫療并提高醫療質量。構建預測性統計模型通常需要從規范化的EHR數據中提取策略預測變量,這是一種勞動密集型過程,且放棄了患者記錄中絕大多數信息。我們提出基于快速醫療保健互操作性資源(FHIR)格式的患者全部EHR原始記錄的表示。我們證明使用這種表示方法的深度學習方法能夠準確預測來自多個中心的多個醫療事件,而無需特定地點的數據協調。我們使用來自兩個美國學術醫療中心的去識別的EHR數據驗證了我們的方法,其中216,221位成年患者住院至少24小時。在我們提出的序列格式中,這一塊EHR數據總計包含了46,864,534,945個數據點,包括臨床說明。深度學習模型對預測院內死亡率(AUROC跨站點0.93-0.94),30天無計劃再入院率(AUROC 0.75-0.76),延長住院時間(AUROC 0.85-0.86)以及所有患者的最終診斷(頻率加權AUROC 0.90)等取得了極高的準確度。在所有情況下,這些模型的表現都優于傳統的預測模型。我們還介紹了一個神經網絡歸因系統的案例研究,該系統說明臨床醫生如何獲得預測的一些透明度。我們相信,這種方法可以為各種臨床環境創建準確的、可擴展的預測,且附有在患者圖標中直接高亮證據的解釋。

在這項研究過程中,他們認為若想大規模的實現機器學習,則還需要對FHIR標準增加一個 協議緩沖區工具 ,以便將大量數據序列化到磁盤以及允許分析大型數據集的表示形式。

昨天,谷歌發布消息稱已經開源該協議緩沖區工具。下面為谷歌博文內容,編譯如下:

過去十年來,醫療保健的數據在很大程度上已經從紙質文件中轉變為數字化為電子健康記錄。但是要想理解這些數據可能還存在一些關鍵性挑戰。

  • 首先,在不同的供應商之間沒有共同的數據表示,每個供應商都在使用不同的方式來構建他們的數據;

  • 其次,即使使用同一個供應商網站上的數據,可能也會有很大的不同,例如他們通常對相同的藥物使用多種代碼來表示;

  • 第三,數據可能分布在許多不同表格中,這些表格有些存在交集,有些包含著實驗數據,還有些包含著一些生命體征。

采用至少一個基本電子病歷系統并擁有經過認證的電子病歷系統的非聯邦急性護理醫院的百分比。Basic的電子健康記錄( Electronic Health Record ,EHR)滿足EHR系統的基本功能,Certified EHR表示醫院已經與EHR有法律協議,但不等同于采用了EHR系統。

快速醫療保健互操作性資源 (Fast Healthcare Interoperability Resources,FHIR)作為一項標準草案,描述的是用于交換電子病歷數據格式和數據元以及應用程序界面,該標準由醫療服務標準組織Health Level Seven International制定。這項標準已經解決了這些挑戰中的大多數:它具有堅實的、可擴展的數據模型,建立在既定的Web標準之上,并且正在迅速成為個人記錄和批量數據訪問中事實上的標準。 但若想實現大規模機器學習,我們還需要對它做一些補充 :使用多種編程語言的工具,作為將大量數據序列化到磁盤的有效方法以及允許分析大型數據集的表示形式。

今天,我們很高興 開源 了FHIR標準的 協議緩沖區工具 ,該工具能夠解決以上這些問題。當前的版本支持Java語言,隨后很快也將支持C++ 、Go和Python等語言。另外,對于配置文件的支持以及幫助將遺留數據轉換為FHIR的工具也將很快推出。

開源地址: https://github.com/google/fhir

協議緩沖區工具: https://developers.google.com/protocol-buffers/

FHIR作為核心數據模型

在過去幾年中,我們一直在與學術醫療中心進行合作,利用機器學習的方法“去識別”(de-identified)醫療記錄(即剝離任何個人身份信息,以預測未來可能的情況,可以在癥候出現前預知患者的需求。),很明顯我們需要正視醫療保健數據中的復雜性。事實上,機器學習對于醫療數據來說非常有效,因此我們希望能夠更加全面地了解每位患者隨著時間的推移發生了什么。作為紅利,我們希望擁有一個能夠直接應用于臨床環境的數據表示。

盡管FHIR標準能夠滿足我們的大多數的需求,但是使用醫療數據將比“傳統”的數據結構更容易管理,并且實現了對立于供應商的大規模機器學習。我們相信緩沖區的引入可以幫助應用程序開發人員(機器學習相關)和研究人員使用FHIR。

協議緩沖區的當前版本

我們已經努力使我們的協議緩沖區表示能夠通過編程式訪問以及數據庫查詢。提供的一個示例顯示了如何將FHIR數據上傳到Google Cloud的BigQuery(注:BigQuery 是 Google 專門面向數據分析需求設計的一種全面托管的 PB 級低成本企業數據倉庫。)并將其提供給外部查詢。我們也正在添加其他直接從批量數據導出并上傳的示例。我們的協議緩沖區遵循FHIR標準(它們實際上是由FHIR標準自動生成的),但也可以采用更優雅的查詢方式。

目前的版本還沒有包括對訓練TensorFlow模型提供支持,但未來將更新。 我們的目標是盡可能地開源我們最近的工作,以幫我們的研究 ,使其更具可重復性并能夠適用于現實世界的場景當中。 此外,我們正與Google Cloud中的同事進行密切合作,研究更多用于管理醫療保健數據的工具。

責任編輯:張燕妮 來源: 雷鋒網
相關推薦

2020-09-28 20:44:44

機器學習開源工具編程語言

2019-05-17 16:13:25

機器學習SQLFlow螞蟻金服

2015-04-13 15:09:36

云計算機器學習趨勢預測

2022-05-30 10:53:48

機器學習醫療行業變革

2020-12-23 13:13:17

機器學習客戶流失客戶

2022-06-09 09:14:31

機器學習PythonJava

2019-05-13 09:22:21

微軟開源機器學習

2020-10-15 17:57:45

開源工具機器學習開發

2020-10-13 14:54:11

機器學習技術工具

2017-05-03 19:08:10

機器學習

2020-10-06 15:12:35

機器學習

2020-06-12 08:19:21

機器學習技術工具

2010-06-12 17:53:14

ARP協議

2020-06-01 19:37:17

電力可再生能源機器學習

2015-11-10 14:01:51

機器學習谷歌開源

2020-01-31 16:08:00

?機器學習數據技術

2017-07-25 12:09:10

機器學習預測性維護模型

2022-02-13 23:10:35

機器學習醫療技術

2018-08-30 14:58:12

機器學習磁盤故障

2018-11-26 11:57:33

NVIDIARAPIDSGPU
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 毛片免费视频 | 日韩精品一区二区三区四区 | 狠狠艹| 黄色大片免费网站 | 国产精品呻吟久久av凹凸 | 91免费在线播放 | 欧美国产一区二区三区 | 亚洲av毛片| 免费在线视频精品 | 国产不卡在线观看 | 色综合99| 亚洲高清视频一区二区 | 97天天干 | 热久久久 | 国产一区精品 | 欧美在线一区二区三区 | 久久精品中文字幕 | 国产精品视频一二三 | 欧美综合视频在线 | 一级特黄色毛片 | 亚洲国产精品一区二区久久 | 精品久久久久久久久久久久 | 黄色大片在线播放 | 久久精品二区 | 日本手机看片 | 在线久草| jlzzjlzz国产精品久久 | 日韩二三区 | 欧美一区二区三区大片 | 97国产精品 | av在线播放免费 | 精品在线播放 | 大陆一级毛片免费视频观看 | 麻豆精品一区二区三区在线观看 | 中文字幕一级毛片 | 亚洲国产专区 | 成人影院一区二区三区 | 欧美色999| 日韩成人影院 | 亚洲精品字幕 | 亚洲国产精品久久 |