成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

哈佛新論文揭示 Transformer 模型與人腦“同步糾結”全過程!AI也會猶豫、反悔?

人工智能
AI在遇到難題時,真的會“走彎路”,和人一樣“卡殼”;不同的任務,不同的模型規模,AI的“思考路徑”也會變化;這種“動態過程”不是專為模仿人類設計,而是AI自然訓練出來、為了完成任務自己學會的“捷徑”;

近日,來自哈佛大學、布朗大學以及圖賓根大學研究者們,共同發表了一項關于Transformer模型與人類認知處理相關性的研究論文:

——《Linking forward-pass dynamics in Transformers and real-time human processing》

意譯過來就是:Transformer模型的“思考過程”與人類大腦實時認知的奇妙相似

圖片圖片

換句話說,它想搞清楚一個“老問題”:AI模型的內部處理過程,和人類大腦的實時認知,有多少相似?

過去我們研究AI和人類的相似性,最常見的做法是什么?“看結果”:讓AI做題,看它答對多少,概率分布和人的選擇對不對得上。例如,讓GPT寫作文、識別圖片、做邏輯推理,然后對照人類的數據,得出一個“AI越來越像人了”的結論。

但這其實只是表象。

想象一個場景:在答一道不太確定的選擇題,先想到了一個看似正確的選項,但又覺得不太對,猶豫半天,才最終敲定答案。AI模型也一樣,也許在中間某一層,更傾向于一個“直覺答案”,但再往后,才被訓練出來的知識“糾正”了過來。

問題來了:AI和人類,不只是最后的選項,連中間的“掙扎”和“轉變”也能被對齊嗎?

這篇論文的作者,換了個角度:不只看AI模型的輸出,還要扒一扒Transformer每一層的“處理動態”,與人腦處理信息的“實時軌跡”是否能對上。

1.AI和人腦,真的在“想”同一件事嗎?

圖片圖片

圖注:方法概述。用Transformer模型中得出的過程性指標預測人類處理負荷和行為反應指標的能力。

論文作者把Transformer每一層的輸出和變化都做了記錄,提出了一系列“處理負載”的指標:

  • 不確定性(entropy)
  • 信心(log probability)
  • 相對信心(正確vs直覺答案)
  • boosting(模型在某一層對正確答案的主動“拉高”)

這些東西聽起來很技術,但可以簡單理解為:AI每一層都在“思考”,每過一層,它對答案的信心發生了一點點變化。

有的題,AI一上來就很有把握,信心很快升高;有的題,AI在中間反復徘徊,甚至先押錯,再修正。

這和我們人類做題的“熟練-猶豫-反應慢-反悔-最終確定”是不是很像?

2.實驗結果:AI和人類“走彎路”的相似瞬間

圖片圖片

圖注:研究中分析的人類任務示意圖。(a) 回憶(自由回答)首都名稱。(b) 識別(強制選擇)首都名稱。(c) 通過鼠標移動對典型和非典型動物實例進行分類(Kieslich 等, 2020)。(d) 判斷三段論推理的邏輯有效性。(e) 對分布外圖像進行物體識別。

論文做了幾個個實驗,分別對應不同的認知任務和人機對比:

1)“首都殺手題”——AI和人類的集體下意識。

圖片圖片

圖注:研究1a(回憶首都),Llama-2 7B模型。(a)-(d) 基于模型各層計算的處理指標。(e) 各指標相較于基線模型的BIC差異。數值越高越好。星號表示統計顯著。

比如,美國州首都題。這題在答題界有個綽號,叫“首都殺手”:

  • 出題人問:“伊利諾伊州的首都是哪?”
  • 人類幾乎下意識地想說:“芝加哥!”
  • 然后突然一個激靈,想起,“不對,是斯普林菲爾德!

以為這樣的“反轉”只有人類會有?其實AI也會!

論文里的Llama-2模型,每一層都像個小AI腦細胞在投票。結果顯示:在模型的中間層,AI的信心值一度“押寶”在芝加哥上,就像腦海里那個脫口而出的錯誤答案。可到了后半程,隨著層數加深,AI忽然“剎車”,把信心轉回了斯普林菲爾德。這就是AI和人類都在“下意識→反思→修正”的本能流程里打了個滾。

更絕的是,有的試題AI和人類都“執迷不悟”。比如問“澳大利亞首都”,一堆人寫悉尼,一堆AI也把概率壓在悉尼上,最后才有一部分“覺醒”,想起是堪培拉。

2)“鯨魚歸屬”——鼠標和神經元一起漂移

圖片圖片

圖注:研究2(動物實例分類),Llama-2 7B模型。(a)-(d) 基于模型各層計算的處理指標。(e) 各指標與基線模型的BIC差異,數值越高越好。星號表示統計顯著。

再看動物分類題。問:“鯨魚是魚還是哺乳動物?”人類是不是腦子里先蹦出來“魚”,又覺得哪里不對,才慢慢改口?

  • 人類實驗里,受試者的鼠標先朝“魚”方向飄過去,走了一小段“彎路”,再折回“哺乳動物”,畫出一條漂亮的“糾結弧線”。
  • AI模型內部,“信心”指標在前幾層也更偏向“魚”,直到后面層數才被訓練出的知識拉回“哺乳動物”

有趣的是,AI和人類不僅選項重合,連“走神”的路徑也同步:人類在鼠標上徘徊的那一秒,AI在網絡里也“猶豫”著。

3) “邏輯陷阱”——AI和人類被套路的瞬間

圖片圖片

圖注:(三段論推理中的內容效應),Llama-2 7B模型。(a)-(d) 針對邏輯結果與先驗信念一致的題目,基于模型各層計算的處理指標。(e)-(h) 針對引發“內容效應”的題目(即邏輯結果與先驗信念不一致),基于模型各層計算的處理指標。(i) 各指標及數據子集與基線模型的BIC差異,數值越高越好。由于EntropyLayer和BoostLayer在所有題目中的數值相同,因此未進行比較。

再來點燒腦的。經典的三段論邏輯推理題:

“所有A是B,所有B是C,那么所有A是C嗎?”

人類本來邏輯在線,但題目稍微摻點“常識偏見”,比如“所有有翅膀的動物會飛,所有會飛的動物能上天,所以所有有翅膀的動物都能上天嗎?”大腦會直接被“常識”帶偏。

AI也是。論文里發現:只要題目設計得足夠“繞”,AI和人類一樣,都在中間層“陷入迷霧”,先押寶在那個直覺答案上,過了幾個“腦回路”,才慢慢拉回正軌。

4)“圖片辨認”——AI和人類都在“霧里看花”

圖片圖片

圖注:OOD物體識別,ViT-Base模型。(a)-(b) 基于模型各層計算的處理指標。(c) 各指標分組與基線模型的BIC差異,數值越高越好。

視覺任務上也是同理。比如一張加了馬賽克或奇怪濾鏡的貓咪圖片,問“這是啥?”你可能先說“狗?”,再揉揉眼睛,才發現是“貓”。

AI的Vision Transformer也是這樣,剛開始層級信心分布很分散,也許更偏向“狗”,但隨著層數推進,才慢慢聚焦到“貓”這個類別。

有沒有發現?AI和人的“迷茫-清醒”過程竟然如此一致。

3 .OMT:應該關注AI內部的“思考過程”

我們一直用AI做“黑箱”——輸入-輸出,像函數一樣。但這篇論文告訴我們,也許更值得關注的,是AI內部的“思考過程”。

AI在遇到難題時,真的會“走彎路”,和人一樣“卡殼”;不同的任務,不同的模型規模,AI的“思考路徑”也會變化;這種“動態過程”不是專為模仿人類設計,而是AI自然訓練出來、為了完成任務自己學會的“捷徑”;

這意味著,也許我們能用AI,去發現哪些刺激、哪些設計會讓人類更難處理,甚至反向指導人類實驗設計。

輸出只是終點,過程才是靈魂。

責任編輯:武曉燕 來源: 大數據文摘
相關推薦

2011-02-22 10:46:02

Samba配置

2009-12-08 17:56:16

WCF配置

2011-04-18 15:56:10

軟件測試

2009-04-13 12:37:18

2011-09-06 15:38:20

QT安裝

2011-01-21 17:51:52

2022-10-19 16:08:07

人工智能深度學習

2010-03-01 17:01:03

Python編程技巧

2010-03-10 13:24:45

Zend Debugg

2010-11-19 10:11:49

Oracle物化視圖

2012-11-06 10:19:18

Java自定義加載Java類

2010-06-17 13:10:09

Linux Grub修

2009-06-10 16:55:42

cygwin netb安裝

2010-07-21 14:51:19

telnet-serv

2019-05-14 15:27:31

MongoDB自動備份數據庫

2011-03-11 10:39:02

YUM安裝LAMP

2010-06-12 10:03:20

Ubuntu Grub

2017-04-25 18:03:11

Caffe深度學習框架

2009-12-15 16:51:32

2010-02-23 11:35:38

Python 項目測試
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: www.99热这里只有精品 | 国产成人在线视频 | 亚洲精品一区二区网址 | 午夜码电影 | 国产精品免费在线 | 日韩精品视频一区二区三区 | 欧美专区在线 | 久久成人免费 | 国产91一区二区三区 | 国产精品久久视频 | 99精品在线| 在线观看成人 | 日本一区二区三区精品视频 | 国产成人精品久久二区二区 | 日日干天天操 | 国产美女精品 | 国产在线网站 | 亚洲免费在线播放 | 日韩免费av一区二区 | 亚洲码欧美码一区二区三区 | 色99视频 | 日韩免费一区 | 天天天操 | 天天操天天怕 | 欧美性猛交 | 91久久久久久久久久久 | 国产黄色麻豆视频 | 欧美日韩久久久久 | 夜夜骑天天干 | 日韩无| a黄视频 | 国产乱码精品一区二区三区忘忧草 | 国产一区二 | 亚洲天天干 | 欧美性生活一区二区三区 | 中文字幕久久精品 | 天天亚洲| 一区二区三区影院 | 久久天天躁狠狠躁夜夜躁2014 | 91精品国产一区二区在线观看 | 欧美精品在线一区 |