成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI語音轉錄工具被曝嚴重幻覺:轉錄100小時,一半兒在瞎扯

人工智能
Whisper是OpenAI老早前推出的開源自動語音識別(ASR)系統,于2022年9月發布。它采用簡單的端到端方式,基于編碼器-解碼器Transformer架構。輸入音頻將被分成30秒的塊,轉化為梅爾倒譜(音頻特征提取方式之一,log-Mel spectrogram),然后傳入編碼器。

OpenAI的AI語音轉寫工具,那個號稱近乎“人類水平”的Whisper,被曝幻覺嚴重——

100多小時轉錄,被工程師發現約一半都在瞎扯。

更嚴重的是,美聯社還爆料有醫療機構利用Whisper來轉錄醫生與患者的會診,瞬間引發大量網友關注。

圖片

據悉,明尼蘇達州的曼卡托診所和洛杉磯兒童醫院在內的超過30000名臨床醫生和40個衛生系統已開始使用法國AI診療公司Nabla基于Whisper打造的工具。

而且他們已經轉錄了大概700萬次醫療就診。

網友紛紛表示這就有點嚇人了。

圖片

值得一提的是,OpenAI之前早就警告過,該工具不應在“高風險領域”中使用。

針對最新爆料,有OpenAI發言人回應,OpenAI會在模型更新中加入相應的反饋機制。

OpenAI被督促趕緊解決此問題

Whisper是OpenAI老早前推出的開源自動語音識別(ASR)系統,于2022年9月發布。

圖片

它采用簡單的端到端方式,基于編碼器-解碼器Transformer架構。輸入音頻將被分成30秒的塊,轉化為梅爾倒譜(音頻特征提取方式之一,log-Mel spectrogram),然后傳入編碼器。

經過68萬小時的多語言和多任務監督網絡數據的訓練,Whisper可以進行多語言轉錄。

Whisper推出后得到廣泛應用,如今GitHub已攬獲70.2k標星:

圖片

據悉,它還被集成在ChatGPT的一些版本中,同時也是Oracle和微軟云計算平臺的一項內置服務,而這些平臺為全球數千家公司提供服務。

此外,僅在上個月,HuggingFace上的一個最新版本Whisper就被下載了超420萬次。HuggingFace社區的機器學習工程師Sanchit Gandhi表示,Whisper是最受歡迎的開源語音識別模型。

而現在,據美聯社報道,很多研究人員和工程師反映,在工作中他們經常遇到Whisper產生的幻覺。

例如,密歇根大學的一位研究員在嘗試改進模型之前,發現其檢查的每10份音頻轉錄中有8份出現了幻覺。

一位機器學習工程師指出,在他分析的超過100小時Whisper轉錄中,大約一半出現了幻覺。

還有一位開發者表示,在他使用Whisper創建的26,000份轉錄中,幾乎每一份都發現了幻覺。

……

這種問題甚至存在于錄制良好的短音頻樣本中。

在最近的一項研究中,計算機科學家們在審查的超過13000個清晰音頻片段中發現了187個幻覺。

工程師和研究人員表示,他們從未見過其它任何AI驅動的轉錄工具像Whisper這樣頻繁地產生幻覺。

Whisper幻覺嚴重的原因目前尚未可知,但有軟件開發者表示,這些虛構內容往往發生在停頓、有背景聲音或音樂播放時

圖片

之前,OpenAI就有提醒:

不要在決策情境中使用Whisper,準確性上的缺陷可能導致結果出現明顯偏差。

然鵝,美聯社表示,這一警告并未阻止一些醫院或醫療中心使用Whisper等語音轉文字模型——

包括明尼蘇達州的曼卡托診所和洛杉磯兒童醫院在內,已經有超30000名臨床醫生和40個醫療系統已經開始使用由Nabla公司基于Whisper開發的工具。

Nabla CTO Martin Raison稱,該工具針對醫療語言對模型進行了微調,用于轉錄和總結患者的交流。

目前,該工具已被用于轉錄約700萬次醫療就診。

在得知Whisper可能會產生幻覺后,Nabla表示正在解決此問題,不過:

由于“數據安全原因”,Nabla的工具會刪除原始音頻,無法將Nabla生成的AI文本與原始錄音進行比較。

此外,據了解,Whisper還被用來為聾人和聽力障礙者創建字幕。

Whisper幻覺嚴重問題被發現后,有人敦促OpenAI趕緊解決此問題。

今年2月離開OpenAI的研究員William Saunders也開麥了:

如果公司愿意優先考慮,這似乎是可以解決的。如果你把它放出去,人們過于自信于它的功能,并將其集成到所有這些其他系統中,那就成了問題。

有OpenAI發言人回應稱,公司持續研究如何減少幻覺現象,并感謝研究人員的發現,同時補充道OpenAI會在模型更新中融入相應反饋機制。

參考鏈接:
[1]https://apnews.com/article/ai-artificial-intelligence-health-business-90020cdf5fa16c79ca2e5b6c4c9bbb14。

[2]https://x.com/AP/status/1850150400424345858。

責任編輯:姜華 來源: 量子位
相關推薦

2024-04-07 07:36:30

OpenAIGPT-4大型語言模型

2021-10-14 15:05:38

TikTok字節跳動薪水

2024-10-28 09:38:16

OpenAIWhisper人工智能

2015-12-03 09:02:22

掌握新事物100小時

2025-02-12 12:47:01

2015-08-26 10:14:29

2023-10-12 12:11:58

2016-01-08 13:48:56

2023-08-07 18:23:50

OpenAIChatGPT

2023-11-20 16:02:34

ChatGPT人工智能OpenAI

2024-11-22 08:22:58

2025-01-20 15:22:55

2023-07-21 14:25:17

2024-09-26 08:21:41

2023-01-30 17:14:40

人工智能語音識別

2024-11-14 18:40:57

2019-02-21 10:11:49

2015-07-07 17:28:48

2015-10-12 10:07:19

2022-09-23 15:33:48

iOS16耗電功能
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美一区2区三区3区公司 | xx性欧美肥妇精品久久久久久 | 黄色免费观看 | 中文字幕视频在线 | 国产在线观看免费 | 亚洲精品一区二区在线观看 | 亚洲vs天堂 | 欧美v日韩v | 91精品国产91久久久久久吃药 | 亚洲一区二区三区在线播放 | 一区二区在线 | a视频在线播放 | 国产精品久久久久一区二区三区 | 天天弄天天操 | 亚洲精品电影网在线观看 | 亚洲成av| 午夜免费 | 中文字幕一区二区三区四区五区 | www.天天操 | 日本在线中文 | 天天躁天天操 | 日韩电影中文字幕在线观看 | 欧美极品一区二区 | 一级片片 | 婷婷色国产偷v国产偷v小说 | 亚洲视频一区在线观看 | 色婷婷av一区二区三区软件 | a级大片免费观看 | 天天操网 | 国产一区二区三区视频在线观看 | 亚洲久视频 | 久久99精品国产99久久6男男 | 激情五月综合 | 好姑娘影视在线观看高清 | 玖玖玖在线观看 | 久久成人精品一区二区三区 | 日韩福利视频 | 91精品久久久久久久久 | 国产精品v | 毛片在线视频 | 欧美在线视频不卡 |