成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

麻省理工研究人員提高機器學習模型準確性

人工智能 機器學習
機器學習(ML)有可能通過利用大量數據進行預測洞察來改變醫療決策。然而,當這些模型在不能充分代表所有人口群體的數據集上進行訓練時,就會出現一個嚴重挑戰。

機器學習(ML)有可能通過利用大量數據進行預測洞察來改變醫療決策。然而,當這些模型在不能充分代表所有人口群體的數據集上進行訓練時,就會出現一個嚴重挑戰。預測疾病患者治療計劃的模型可以在主要包含男性患者的數據集上進行訓練。這可能會導致對女性患者的預測不準確。這種偏見可能會導致有害的建議,特別是對代表性不足的群體。

一種解決方案是調整或平衡訓練數據集,以確保所有子組都得到平等表示。然而,這種數據平衡方法增加了復雜性,也可能降低模型的整體性能。此外,這種方法可能需要訪問訓練組注釋,最終可能會刪除數據集的大部分。

麻省理工學院的研究人員采取了不同的方法。他們開發了一種新技術,可以識別和刪除訓練數據集中對模型在代表性不足的群體中表現不佳影響最大的特定點。

這種技術沒有假設每個數據點對模型的性能都有同等的貢獻,而是認識到某些點對模型有偏見的預測產生了不成比例的影響。

研究人員的數據模型去偏(D3M)首先使用了一種稱為最差組誤差的指標,該指標衡量模型在某些亞群上的表現有多差。然后,該模型通過使用他們稱之為數據建模的框架來提高性能,該框架將預測近似為列車數據的簡單函數。這使他們能夠量化單個數據點如何影響最差的團隊績效。

使用這種方法,研究人員可以識別出最有問題的數據點。然而,這種模型并沒有刪除大部分數據,而是選擇性地只刪除最有害的數據。

在代表性不足的數據缺失或未標記的情況下,D3M的方法仍然可以通過分析數據本身來發現隱藏的偏見,使其成為提高公平性的有力工具,即使數據有限或未標記。

麻省理工學院電氣工程與計算機科學(EECS)研究生、在arXiv上發表的一篇論文的共同主要作者Kimia Hamidieh說:“許多其他試圖解決這個問題的算法都假設每個數據點都和其他數據點一樣重要。在這篇論文中,我們證明了這一假設是不正確的。我們的數據集中有一些特定的點導致了這種偏見,我們可以找到這些數據點,刪除它們,并獲得更好的性能。”

Hamidieh與來自麻省理工學院的Saachi Jain、Kristian Georgiev、Andrew Ilyas以及資深作者Marzyeh Ghassemi和Aleksander Madrt共同撰寫了這篇論文。這項研究將在神經信息處理系統會議上發表。

研究人員的新技術建立在他們之前的工作基礎上,他們開發了一種名為TRAK的方法,該方法可以為特定的模型輸出確定最有影響力的訓練示例。

麻省理工學院的團隊聲稱,D3M方法提高了最差的組準確率,同時比傳統的數據平衡方法減少了約20000個訓練樣本。

Hamidieh說:“這是任何人在訓練機器學習模型時都可以使用的工具。他們可以查看這些數據點,看看它們是否與他們試圖教授模型的能力相一致。”

研究人員計劃驗證這種方法,并通過未來的人體研究進一步發展它。他們的目標之一是使該方法易于使用,便于醫療保健專業人員使用,從而可以在現實環境中部署。

根據該論文的合著者Ilyas的說法,“當你有工具可以批判性地查看數據并找出哪些數據點會導致偏見或其他不良行為時,它就為你構建更公平、更可靠的模型邁出了第一步。”

這項研究的結果可能有助于解決人工智能和機器學習模型的一個長期問題:它們的有效性取決于它們所訓練的數據。如果可以通過可擴展的算法識別和刪除降低人工智能模型整體性能的數據點,特別是對于大型數據集,這可能會改變游戲規則,提高各種應用程序的模型準確性和可靠性。

責任編輯:華軒 來源: Ai時代前沿
相關推薦

2024-07-17 13:47:53

2022-08-05 23:19:33

人工智能機器學習3D打印機

2021-06-01 10:38:55

人工智能AI機器學習

2022-04-11 15:40:34

機器學習研究推理

2023-06-14 15:53:53

人工智能深度學習醫療健康

2024-06-04 15:11:12

2021-11-02 21:24:32

人工智能走捷徑機器學習

2019-08-20 09:26:48

AI人工智能麻省理工學院

2019-10-16 11:52:15

MIT機器學習

2023-11-15 20:14:25

人工智能機器學習

2016-01-15 09:59:12

機器學習數據集

2022-07-15 09:25:01

AI制藥

2021-11-06 10:53:07

機器學習機器人AI

2020-10-11 20:10:59

技術人工智能麻省理工

2021-11-24 17:48:30

深度學習風險預測

2024-06-05 15:02:59

生成式人工智能機器學習人工智能

2017-01-17 14:16:40

2021-09-10 17:00:01

ARROW光纖網絡麻省理工

2020-10-06 15:12:35

機器學習

2024-12-09 13:20:50

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 伊人一区| 69福利影院| 蜜桃一区 | 国产精品一区二区av | 久久精品色欧美aⅴ一区二区 | 欧美日韩亚洲国产 | 刘亦菲国产毛片bd | 一级黄色毛片免费 | a级免费观看视频 | 中文字幕爱爱视频 | 亚洲第一视频网 | 男女羞羞视频在线 | 欧美激情视频网站 | 极品电影院 | 午夜免费福利片 | 黄色片在线看 | 欧美成人精品 | 成人小视频在线观看 | 久久久久黄| 日韩一区二区三区在线看 | 91精品国产一区二区三区动漫 | 看片地址 | 亚洲 欧美 激情 另类 校园 | 中文字幕加勒比 | 久草在线青青草 | 亚洲欧美一区二区三区在线 | 天天操夜夜爽 | 欧美日韩国产一区二区三区 | 亚洲成人精品久久 | 亚洲人成人一区二区在线观看 | 91亚洲国产成人久久精品网站 | 亚洲日本欧美日韩高观看 | 国产乱码精品一区二区三区忘忧草 | 国产成人精品综合 | 一区二区三区小视频 | 国产一区二区在线免费观看 | 免费一看一级毛片 | 久久久高清 | 国产原创视频 | 久久久久国产一级毛片高清网站 | 亚洲欧美日韩精品久久亚洲区 |