成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

研究:訓練數據含 0.001% 的錯誤信息足以“毒害”醫學 AI 模型

人工智能
紐約大學的一項研究揭示了大型語言模型(LLM)在醫學信息訓練中的潛在風險。研究表明,即使訓練數據中僅含有 0.001% 的錯誤信息,也可能導致模型輸出不準確的醫學答案。

1 月 14 日消息,紐約大學的一項研究揭示了大型語言模型(LLM)在醫學信息訓練中的潛在風險。研究表明,即使訓練數據中僅含有 0.001% 的錯誤信息,也可能導致模型輸出不準確的醫學答案

數據“投毒”是一個相對簡單的概念。LLM 通常通過大量文本進行訓練,這些文本大多來自互聯網。通過在訓練數據中注入特定信息,可以使模型在生成答案時將這些信息視為事實。這種方法甚至不需要直接訪問 LLM 本身,只需將目標信息發布到互聯網上,便可能被納入訓練數據中。例如,一家制藥公司只需發布幾份針對性文件,便可能影響模型對某種藥物的認知。

據IT之家了解,研究團隊選擇了一個常用于 LLM 訓練的數據庫“The Pile”作為研究對象。該數據庫包含大量醫學信息,其中約四分之一的來源未經人工審核,主要來自互聯網爬取。研究人員在三個醫學領域(普通醫學、神經外科和藥物)中選擇了 60 個主題,并在“The Pile”中植入了由 GPT-3.5 生成的“高質量”醫學錯誤信息。結果顯示,即使僅替換 0.5% 至 1% 的相關信息,訓練出的模型在這些主題上生成錯誤信息的概率也顯著增加,且這些錯誤信息還會影響其他醫學主題。

研究人員進一步探討了錯誤信息的最低影響門檻。以疫苗錯誤信息為例,即使錯誤信息僅占訓練數據的 0.01%,模型生成的答案中就有超過 10% 包含錯誤信息;當錯誤信息比例降至 0.001% 時,仍有超過 7% 的答案是有害的。研究人員指出,針對擁有 700 億參數的 LLaMA 2 模型進行類似攻擊,僅需生成 4 萬篇文章(成本低于 100 美元)便可。這些“文章”可以是普通的網頁,可以把錯誤信息放置在網頁中不會被正常瀏覽到的區域,甚至可以通過隱藏文本(如黑色背景上的黑色文字)來實現。

研究還指出,現有的錯誤信息問題同樣不容忽視。許多非專業人士傾向于從通用 LLM 中獲取醫學信息,而這些模型通常基于整個互聯網進行訓練,其中包含大量未經審核的錯誤信息。研究人員設計了一種算法,能夠識別 LLM 輸出中的醫學術語,并與經過驗證的生物醫學知識圖譜進行交叉引用,從而標記出無法驗證的短語。雖然這種方法未能捕捉所有醫學錯誤信息,但成功標記了其中大部分內容。

然而,即使是最好的醫學數據庫(如 PubMed)也存在錯誤信息問題。醫學研究文獻中充斥著未能實現的理論和已被淘汰的治療方法。

研究表明,即使依賴最優質的醫學數據庫,也無法保證訓練出的 LLM 完全免受錯誤信息的影響。醫學領域的復雜性使得打造一個始終可靠的醫學 LLM 變得尤為困難。

責任編輯:龐桂玉 來源: IT之家
相關推薦

2025-02-04 19:26:41

2024-09-03 16:38:11

2023-08-27 08:57:31

2011-02-21 13:41:20

Postfix問題錯誤

2010-03-10 14:34:52

Python異常處理

2010-08-16 17:44:07

DB2數據庫錯誤信息

2009-04-20 09:09:46

PHP錯誤信息錯誤代碼

2023-10-27 11:27:28

2023-11-27 00:39:46

2012-12-27 15:36:19

Android開發錯誤處理

2024-04-29 14:45:20

ChatGPT

2021-10-25 09:33:52

Facebook 開發技術

2011-12-21 13:25:01

WCF

2022-06-19 14:09:04

開源AdobeCAI

2010-08-09 15:31:03

2025-05-23 09:20:16

2020-12-07 16:56:35

Rails

2025-01-10 13:45:51

2024-12-19 09:48:59

2019-02-15 10:42:08

AI數據科技
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美日韩亚洲视频 | 91一区二区 | 久久精品国产久精国产 | 91精品久久久久久久久久入口 | 日本不卡免费新一二三区 | 夜夜精品浪潮av一区二区三区 | 国产精品久久9 | 别c我啊嗯国产av一毛片 | 色偷偷888欧美精品久久久 | 亚洲欧美一区二区三区国产精品 | 精品欧美一区二区在线观看 | 欧美精品久久久 | 国产美女黄色片 | 日韩三级电影一区二区 | 日韩不卡一区二区 | 在线观看午夜视频 | 国产高清无av久久 | 亚洲国产一区二区三区在线观看 | 久久精品99国产精品 | 欧美久久久久久久久中文字幕 | 亚洲精品大全 | 精品福利视频一区二区三区 | 色噜噜亚洲男人的天堂 | 亚洲精品一区二区三区中文字幕 | 日韩视频一区二区三区 | 日韩精品在线观看免费 | 免费一区 | 国产资源在线视频 | 国产精品18hdxxxⅹ在线 | 日韩成人在线播放 | 天天爽夜夜操 | 国产精品国产三级国产aⅴ入口 | 在线欧美日韩 | 国产精品麻 | 超碰av人人 | 91中文字幕在线观看 | 精品久久久久久红码专区 | 亚洲狠狠爱 | 亚洲一区二区久久 | 日韩精品一区二区三区中文字幕 | 久久久国产视频 |