成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

如何應(yīng)對(duì) AI“一本正經(jīng)的胡說八道”?研究人員希望它會(huì)承認(rèn)“我不知道”

人工智能
《華爾街日?qǐng)?bào)》當(dāng)?shù)貢r(shí)間 11 日發(fā)布文章,探討了當(dāng)前“AI 幻覺”的現(xiàn)象和潛在解法。該報(bào)記者 Ben Fritz 向多款全球最先進(jìn)的 AI 聊天機(jī)器人詢問“自己的配偶是誰”,得到的答案卻令本人匪夷所思:一位自己并不認(rèn)識(shí)的作家、一名來自愛荷華州的陌生女性,還有一名網(wǎng)球運(yùn)動(dòng)博主。

2 月 13 日消息,《華爾街日?qǐng)?bào)》當(dāng)?shù)貢r(shí)間 11 日發(fā)布文章,探討了當(dāng)前“AI 幻覺”的現(xiàn)象和潛在解法。該報(bào)記者 Ben Fritz 向多款全球最先進(jìn)的 AI 聊天機(jī)器人詢問“自己的配偶是誰”,得到的答案卻令本人匪夷所思:一位自己并不認(rèn)識(shí)的作家、一名來自愛荷華州的陌生女性,還有一名網(wǎng)球運(yùn)動(dòng)博主。

根據(jù)報(bào)道,盡管 AI 在解決復(fù)雜數(shù)學(xué)問題和模擬人類交流方面表現(xiàn)出色,但在基本事實(shí)上卻常常出錯(cuò)。它們會(huì)捏造法律案件,混淆電影和書籍的情節(jié),甚至“憑空”編造配偶。

IT之家注:上述錯(cuò)誤往往被稱作“幻覺”,因?yàn)?ChatGPT、Gemini 等 AI 即使在生成錯(cuò)誤答案時(shí)也會(huì)表現(xiàn)得極其自信

曾在 IBM、微軟實(shí)習(xí)的德國(guó) Hasso Plattner 研究所博士生 Roi Cohen 表示,這是當(dāng)前 AI 研究最熱門的方向之一。

AI 的工作原理是預(yù)測(cè)答案中最可能出現(xiàn)的下一個(gè)單詞。從本質(zhì)上看,這一過程更像是一種高級(jí)猜測(cè)。AI 往往會(huì)以堅(jiān)定的語氣給出最可能正確的答案,而不會(huì)表現(xiàn)出任何不確定性,這就像學(xué)生在多項(xiàng)選擇題考試中作答,或是社交場(chǎng)合中隨口應(yīng)對(duì)問題的人一樣。

西班牙瓦倫西亞人工智能研究所的教授 José Hernández-Orallo 解釋道,“AI 之所以會(huì)產(chǎn)生幻覺,根本原因在于,如果它什么都不猜,就完全不可能答對(duì)。”

為了解決這個(gè)問題,研究人員正嘗試“檢索增強(qiáng)生成”(retrieval augmented generation)技術(shù),讓 AI 在回答問題時(shí)先從互聯(lián)網(wǎng)或文檔庫中查找最新信息,而不是完全依賴已有的訓(xùn)練數(shù)據(jù)。

在去年 12 月的 NeurIPS AI 研究會(huì)議上,Cohen 和同校博士生 Konstantin Dobler 提出了一個(gè)簡(jiǎn)單但富有新意的想法:讓 AI 也學(xué)會(huì)承認(rèn)“我不知道”。

報(bào)道指出,當(dāng)前 AI 的訓(xùn)練數(shù)據(jù)幾乎不包含“我不知道”這樣的表述,因此它們天生不會(huì)謙遜。Cohen 和 Dobler 通過調(diào)整 AI 訓(xùn)練過程,使其在可能出錯(cuò)時(shí),至少一部分情況下會(huì)選擇回答“我不知道”,從而提高整體準(zhǔn)確性。

不過,如何平衡這一策略仍是個(gè)難題。有時(shí)候,AI 說“我不知道”,但其實(shí)答案就在它的訓(xùn)練數(shù)據(jù)里。

即便如此,對(duì)于那些依賴 AI 提供精準(zhǔn)信息的領(lǐng)域,適當(dāng)?shù)摹爸t虛”可能更有價(jià)值。“關(guān)鍵是讓 AI 具備實(shí)用性,而不是一味追求智能。”Dobler 說道。

雖然 AI 變得越來越強(qiáng)大,但美國(guó)公眾對(duì)其的信任感卻在下降。皮尤研究中心數(shù)據(jù)顯示,2023 年 52% 的美國(guó)人對(duì) AI 感到擔(dān)憂,而 2021 年這一比例僅為 37%。

責(zé)任編輯:龐桂玉 來源: IT之家
相關(guān)推薦

2024-03-20 00:00:00

大語言模型人工智能AI

2021-11-16 15:04:36

芯片半導(dǎo)體技術(shù)

2023-04-11 14:32:25

騰訊面試Chunk

2009-06-29 13:28:18

PHP小組PHP技巧網(wǎng)站加速

2021-07-14 11:25:12

CSSPosition定位

2023-05-05 10:28:47

2020-11-19 15:21:26

人工智能

2023-04-02 18:00:56

2024-11-12 08:59:39

2020-02-06 11:08:48

區(qū)塊鏈分布式比特幣

2020-06-12 09:20:33

前端Blob字符串

2020-07-28 08:26:34

WebSocket瀏覽器

2025-03-21 06:00:00

惡意軟件越獄技術(shù)漏洞

2021-03-25 11:19:34

Windows 10Windows微軟

2021-01-04 05:46:00

AI人工智能深度學(xué)習(xí)

2023-06-14 15:53:53

人工智能深度學(xué)習(xí)醫(yī)療健康

2023-06-16 09:49:11

人工智能研究

2025-03-31 08:30:00

AI模型技術(shù)

2021-02-02 09:32:06

黑客攻擊l安全

2024-03-28 08:00:00

人工智能多模態(tài)語言模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 国产精品久久久亚洲 | 一级在线观看 | 亚洲国产欧美在线人成 | 九九亚洲| 精品一区国产 | 日本成人中文字幕在线观看 | 日韩欧美一级片 | 一区二区三区在线免费看 | 亚洲国产第一页 | 日韩国产一区二区三区 | 国产精品精品视频 | 欧美一区二区大片 | 黄色大片视频 | 日韩中文在线视频 | 欧美一区二区久久 | 精品国产高清一区二区三区 | 成人激情视频网 | 99色视频| 亚洲日韩欧美一区二区在线 | 国产精品国产三级国产播12软件 | 国产精品高潮呻吟久久久久 | 久久久久国产一区二区三区 | 午夜天堂精品久久久久 | 欧美成年人视频在线观看 | 久久综合一区 | 欧美国产精品一区二区三区 | 黄色一级免费看 | 国产一区二区高清在线 | 亚洲精品一区二区三区丝袜 | 免费一级欧美在线观看视频 | 精品中文在线 | 免费黄色的视频 | 久久久久国产 | 欧美国产91 | 久久精品日产第一区二区三区 | 99爱在线观看 | 一区二区在线 | 在线高清免费观看视频 | 色资源站 | 精品国产一区二区三区久久久蜜月 | 在线观看国产视频 |