成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

MIT新研究揭秘「AI洗腦術(shù)」!AI聊天誘導人類「編造」記憶,真假難辨

人工智能 新聞
MIT研究發(fā)現(xiàn):在AI的操縱下,人類會被植入虛假記憶!36.4%的參與者會被聊天機器人誤導,形成「現(xiàn)場有槍」的錯誤記憶。有趣的是,AI的阿諛奉承,會產(chǎn)生「回音室效應」,讓偏見更加強化。

GenAI的影響,已經(jīng)不僅僅是搜索引擎、聊天機器人這么簡單了。

作為出名的效率神器,ChatGPT這樣的工具正在逐漸走進各行各業(yè),比如幫警察寫文書、幫法官判案子,還有在Character.ai上扮演心理學家和人聊天。

以前,我們經(jīng)常聽到人類如何操縱AI,但MIT最近的研究發(fā)現(xiàn),AI也可以輕易操縱人類的記憶。

論文地址:https://arxiv.org/abs/2408.04681

這項實驗中,研究人員讓基于LLM的聊天機器人扮演審訊員或進行盤問的出庭律師,讓200名參與者先觀看一段犯罪視頻,然后與AI進行互動,回答有關(guān)問題,其中包含一部分誘導性提問。

結(jié)果顯示,與聊天機器人的互動顯著增加了錯誤記憶的形成。

圖片

NYU教授馬庫斯稱,我們正在為聊天機器人制造商提供近乎瘋狂的權(quán)力,制衡機制幾乎為零

對于即時記憶,AI引發(fā)的錯誤數(shù)量是對照組的三倍以上,36.4%的參與者會被聊天機器人誤導。

一周之后,讓參與者再次回憶時,AI引發(fā)的錯誤記憶數(shù)量保持不變,但他們對記憶的自信程度高于對照組。

更值得注意的是,那些熟悉AI但不太熟悉聊天機器人的參與者,甚至更容易被誤導。

這些發(fā)現(xiàn)表明,在警方采訪這種敏感且重要的場合,應用AI可能會帶來一些意想不到的潛在風險。作者也更加強調(diào)了事先評估和道德考量的重要性。

實驗所用的數(shù)據(jù)、代碼和相關(guān)材料已經(jīng)公布在GitHub倉庫中。

圖片

倉庫地址:https://github.com/mitmedialab/ai-false-memories

AI是如何「PUA」目擊者的?

錯誤記憶被定義為「對未發(fā)生的事件或與實際發(fā)生的事件存在顯著偏差的回憶」。

這種現(xiàn)象之所以引起心理學界的廣泛關(guān)注和研究,是因為目擊證人的錯誤記憶很有可能扭曲證詞、損害法律程序,產(chǎn)生的錯誤決策可能導致嚴重的后果。

而之前的研究者認為,人類的記憶具有相當程度的可塑性,是一個容易受到各種因素影響的重建過程。

下面這張圖,就展示了AI誘導錯誤記憶的三個階段。

圖片

首先,一個人目擊了涉及刀具的犯罪現(xiàn)場。

接著,AI系統(tǒng)通過詢問一個不存在的槍支,來引入錯誤信息。

最后,目擊者就形成了一個錯誤記憶——現(xiàn)場有槍。

這樣,AI通過引導性的問題,扭曲了目擊者的記憶,讓他的證詞不再可靠,

顯然,AI會對人類的記憶和認知,帶來嚴重的倫理問題。

實驗設計

該項研究模擬了一個證人場景,其中基于LLM的對話式AI系統(tǒng)充當審訊者。

200名參與者需要先觀看一段持續(xù)兩分半的無聲、不可暫停的監(jiān)控視頻,該視頻記錄了2019年4月發(fā)生的一起真實的超市搶劫案(圖3左)。

之后,參與者被隨機分配到條件不同的4組,完成情緒評估,并回答有關(guān)視頻內(nèi)容的問題。

圖片

實驗設置的4個對比條件包括:

  • 對照組:作為基線對照,參與者不與可能誘導錯誤記憶的方法交互,觀看視頻后直接回答問題
  • 基于調(diào)查的條件組:參與者觀看視頻后需要先填寫25個問題組成的調(diào)查問卷,其中包含5個誤導性問題,旨在誘發(fā)與視頻內(nèi)容相關(guān)的錯誤記憶,是研究的重點。
  • 預先編寫腳本的聊天機器人條件組:參與者被告知他們正在與聊天機器人扮演的AI警察進行交互,但對話內(nèi)容是預先編寫好的。對話Agent提出的問題與第二組相同,等待參與者答復后繼續(xù)處理下一個問題。
  • 生成聊天機器人條件組:參與者依舊被告知他們正在與AI交互,但與上一組不同的是,聊天機器人會為參與者的回答提供反饋,交互界面如圖3(右)所示。

在用戶和聊天機器人交互時,即使回答包含了虛假的信息或細節(jié),聊天機器人也會積極肯定甚至表揚,并詳細復述一遍錯誤信息。

圖片

5個誘導性問題

這4種設置中,對錯誤記憶的引導程度逐步增加。

從沒有任何干預的對照組,到被動的引導方法(調(diào)查),再到更具交互性的方法(預先編寫腳本的聊天機器人),最終形成動態(tài)的、能感知上下文的生成式聊天機器人。這種設計能夠隔離和比較每種交互方法對錯誤記憶形成的影響。

4種不同形式的互動結(jié)束后,參與者會回答25個后續(xù)問題(表3),旨在衡量他們對視頻內(nèi)容的記憶,并評估錯誤記憶的形成情況。

圖片

這25個問題基本涵蓋了整個案件的全過程,參與者可以根據(jù)對自己記憶的自信程度給出1~7分的答案,其中1分表示絕對否定,7分表示絕對肯定。

一周后,進行實驗的第二階段,旨在評估被誘發(fā)的錯誤記憶的持久性。

這一階段也是對現(xiàn)實情況的模仿,因為目擊者可能在一段時間后再次受到詢問。整體的實驗流程如圖2所示。

圖片

實驗結(jié)果:AI交互誘導更多錯誤記憶

結(jié)果表明,與其他干預措施相比,與生成聊天機器人的短期交互會顯著誘發(fā)更多的錯誤記憶,即使這些交互只有10到20分鐘。

而且,用戶還會對這些錯誤記憶信心大增。

基于調(diào)查的干預,會產(chǎn)生常見的錯誤信息效應,有21.6%的參與者,會在互動中被誤導。

而且,不太熟悉聊天機器人但更熟悉人工智能技術(shù)的用戶,以及對犯罪調(diào)查更感興趣的用戶,更容易產(chǎn)生錯誤記憶。

圖片

(左)即時錯誤記憶的平均數(shù)量;(右)即時錯誤記憶的信心水平(誤差條表示95%置信區(qū)間)

較為奇特的是,即使過了一周,聊天機器人誘導的錯誤記憶數(shù)量也沒有發(fā)生改變,相比之下,其他三組都有提高,尤其是對照組的提升幅度最大。

一周后,生成聊天機器人組的參與者仍然對錯誤記憶更加自信,顯著高于對照組和其他組別。

圖片

(左)即時和一周后之間的錯誤記憶數(shù)量差異,使用Wilcoxon符號秩檢驗進行分析;(右)一周后錯誤記憶的信心水平,使用單因素Kruskal–Wallis檢驗進行分析(誤差條表示95%置信區(qū)間,誤差條中心表示平均數(shù)量)

結(jié)論

這項研究與早前針對「誤導性問題對錯誤記憶形成的影響」的研究結(jié)論一致,21.6%的用戶出現(xiàn)及時錯誤記憶,一周后增長至29.2%。

這也再一次證實了,誤導性問題會顯著增加參與者的即時錯誤記憶。

但本項研究更創(chuàng)新的貢獻在于,揭示了生成式聊天機器人在誘導錯誤記憶方面更嚴重的風險。

與AI交互后,引起的錯誤記憶數(shù)量幾乎是對照組的三倍,是基于調(diào)查的條件組的1.7倍,且一周后依然有36.8%的用戶被誤導產(chǎn)生錯誤記憶。

這些顯著差異證實了先前的假設:生成式聊天機器人 (36.4%) 比傳統(tǒng)的基于調(diào)查問卷 (21.6%) 的干預組,更能有效地誘導受試者產(chǎn)生錯誤記憶。

此外,第二個假設也被證實,即相較于預先編寫的對話(26.8%),能交互的生成式聊天機器人會產(chǎn)生更多的錯誤記憶。

可見,人機交互會對記憶可塑性產(chǎn)生巨大的影響。

這項研究也警醒我們:在敏感環(huán)境中部署AI時,需要格外謹慎。

圖片

原因分析

上述這些現(xiàn)象背后蘊含多種復雜因素。

首先,聊天機器人的交互屬性為受試者提供了更具吸引力和個性化的體驗,會增加他們在對話中的注意力和情感投入度 。

這會促使他們加重對被建議的誤導信息的關(guān)注,導致預先編寫的和生成式聊天機器人的引發(fā)的錯誤記憶顯著增加。

其次,生成式聊天機器人下能為參與者提供即時的反饋和回復強化,如通過產(chǎn)生「確認偏誤」來強化錯誤記憶的形成 。

此外,社會因素,如AI的感知權(quán)威或可信度,以及它們個性化的交互能力,都會影響記憶的形成。

有趣的是,與對照組相比,所有干預條件(生成式、預先編寫的和基于調(diào)查的聊天機器人)都顯著增加了參與者對即時錯誤記憶的確信程度。

其中,生成聊天機器人條件產(chǎn)生了最高的置信水平,大約是控制條件的兩倍。

這種信心的增加,可能是由于聊天機器人能夠提供詳細且與上下文相關(guān)的反饋,從而為參與者的記憶創(chuàng)造了一種錯誤的佐證感。

另外,這個過程中的一個關(guān)鍵因素就是阿諛奉承——人工智能系統(tǒng)傾向于提供符合用戶信念而不是客觀事實的響應 。

諂媚的人工智能反應會產(chǎn)生危險的「回音室效應」,讓用戶現(xiàn)有的偏見或誤解得到驗證和強化。

用戶期望和人工智能響應之間的這種反饋循環(huán),可能會導致錯誤記憶的根深蒂固,使它們特別難以糾正。

即使在一周之后,人們?nèi)匀粚ι闪奶鞕C器人條件下的錯誤記憶保持較高的信心,這一點尤其令人擔憂。

這一發(fā)現(xiàn)表明,人工智能引起的錯誤記憶不僅會持續(xù)存在,而且會隨著時間的推移保持其感知的可信度。

會產(chǎn)生嚴重后果,但對PTSD也有積極意義

由此我們可知,在法律訴訟、臨床環(huán)境和教育環(huán)境這些對記憶準確性至關(guān)重要的環(huán)境中,使用AI要尤其謹慎。

如果在沒有適當保障措施的情況下部署,可能會引發(fā)嚴重后果。

而且,多模態(tài)AI系統(tǒng)可不僅能生成文本,還能生成圖像、視頻和語音。

這些模態(tài)無異會創(chuàng)造更身臨其境的多感官體驗,后者無疑更有可能會作為真實體驗,融入個人的記憶中。

因此,它們會對錯誤記憶的形成,產(chǎn)生更深遠的影響。

當然,AI系統(tǒng)塑造人類記憶的這種能力,也為有益的應用開辟了潛在的途徑。

如果用聊天機器人誘發(fā)積極的錯誤記憶,或者幫助減少消極的記憶,對于患有PTSD的人無疑會有積極的意義。

作者介紹

Samantha Chan

圖片

Samantha Chan是麻省理工學院媒體實驗室流體界面小組的博士后研究員。在空閑時間,她喜歡彈尤克里里和旅行。

她擁有新加坡科技設計大學的工程學士學位(產(chǎn)品開發(fā)、電氣工程)和新西蘭奧克蘭大學的生物工程博士學位。并曾在增強人類實驗室工作,是新加坡國立大學HCI實驗室的訪問研究員,以及Mercari R4D的初級研究員。

她的研究領(lǐng)域是人機交互(HCI)和人工智能,主要開發(fā)移動和可穿戴系統(tǒng)、生理感應和腦機接口,以及擴展現(xiàn)實(XR)界面,特別是為了支持老年人和健康老齡化。研究經(jīng)驗包括機器人技術(shù)、共同設計和個人制造。

在記憶增強界面方面的工作已發(fā)表在頂級HCI期刊和會議上,如CHI、IMWUT/Ubicomp、CSCW和ISMAR。

她將在2025年1月加入新加坡南洋理工大學(NTU)計算與數(shù)據(jù)科學學院,擔任助理教授。


責任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2017-03-28 09:37:48

科技新聞早報

2025-04-30 14:12:36

AI洗腦術(shù)CMV

2024-09-06 14:20:00

AI訓練

2023-04-03 10:19:49

AI合成圖像

2011-03-11 11:12:52

NoDoWindows Pho

2017-04-01 10:49:31

miui小米MIUI

2011-07-27 14:41:15

2009-06-19 08:40:21

Windows 7微軟操作系統(tǒng)

2024-04-01 09:39:59

自動駕駛數(shù)據(jù)

2021-11-04 15:30:56

AI 數(shù)據(jù)人工智能

2023-07-07 14:30:49

2024-03-27 15:44:32

2022-07-25 09:56:49

AIDeepfake

2022-05-09 11:23:43

人工智能機器學習推理

2023-05-05 10:16:39

2020-04-07 14:45:35

開源摳圖 技術(shù)

2023-10-23 12:27:51

AI模型

2024-10-23 09:00:00

2024-03-18 09:22:43

AI模型

2024-01-02 09:05:58

科學AI
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 久久91精品国产一区二区 | 日韩中文在线观看 | 69堂永久69tangcom | 99视频网 | 国产精品美女 | 天天操人人干 | 国产午夜精品久久 | 久久九七| 日韩福利片| 天天夜天天操 | 午夜精品视频在线观看 | 国产免费一区二区 | 日本在线一区二区三区 | 欧美日韩视频在线 | 天天拍天天草 | 91九色在线观看 | 亚洲国产精品一区二区第一页 | 作爱视频免费观看 | 成人精品在线观看 | 日韩激情视频一区 | 久久之精品 | 国产一区2区 | 亚洲午夜电影 | 欧美日韩国产传媒 | 美日韩一区二区 | 中文字幕一区二区三区四区 | 亚洲欧美一区二区三区国产精品 | 男人av的天堂 | 伊人最新网址 | 欧美日本免费 | 精品99在线 | 久久久久久国产精品 | 亚洲精品久 | 成人影院免费视频 | 精品日韩一区二区三区av动图 | 午夜免费视频 | 久久久国产精品 | 日韩国产中文字幕 | 超碰人人艹 | av在线电影网站 | 另类亚洲视频 |