成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大模型對語言有自己的理解!MIT論文揭示大模型“思維過程” | ICML 24

人工智能 新聞
MIT的一項研究發(fā)現(xiàn),隨著模型能力越強,它對現(xiàn)實的理解可能不僅是簡單模仿。

大模型對現(xiàn)實世界,可以形成自己的理解!

MIT的一項研究發(fā)現(xiàn),隨著模型能力越強,它對現(xiàn)實的理解可能不僅是簡單模仿。

比如大模型沒有聞過氣味,是否就意味著它不能理解氣味?

研究發(fā)現(xiàn),它可以自發(fā)模擬一些概念,方便理解。

這項研究意味著,大模型未來有希望更深入理解語言和世界,論文已被頂會ICML 24接收。

圖片

這篇論文的作者是MIT計算機與人工智能實驗室(CSAIL)華裔博士生Charles Jin和他的導師Martin Rinard教授。

研究當中,作者讓大模型只學習代碼文本,結果發(fā)現(xiàn)模型逐漸掌握了其背后的含義。

Rinard教授表示,這項研究直接針對現(xiàn)代人工智能的一個核心問題——

大模型的能力僅僅是由于大規(guī)模的統(tǒng)計相關性,還是對它們要處理的現(xiàn)實問題產生了有意義的理解?

圖片

△來源:MIT官網

同時這項研究也引發(fā)了不少討論。

有網友表示,雖然大模型對語言的理解可能和人類不同,但這項研究至少說明了模型做的絕不僅僅是對訓練數(shù)據(jù)的記憶。

圖片

讓大模型學習純代碼

為了探究大模型能否產生語義層面的理解,作者構建了一個由程序代碼及其對應輸入輸出組成的合成數(shù)據(jù)集。

這些代碼程序用一種名為Karel的教學語言編寫,主要用于實現(xiàn)機器人在2D網格世界中導航的任務。

這個網格世界由8x8的格子組成,每個格子可以包含障礙物、標記物或空地。機器人可以在格子間移動,并進行放置/拾取標記物等操作。

Karel語言包含5個原始操作——move(前進一步)、turnLeft(左轉90度)、turnRight(右轉90度)、pickMarker(拾取標記物)、putMarker(放置標記物),程序就是由這些原始操作的序列組成。

圖片

作者隨機生成了一個包含50萬個Karel程序的訓練集,每個程序長度在6到10之間。

每個訓練樣本由三部分組成:5個輸入狀態(tài)、5個輸出狀態(tài)和完整的程序代碼,輸入輸出狀態(tài)以特定格式編碼進字符串中。

利用這些數(shù)據(jù),作者訓練了標準Transformer架構的CodeGen模型的一個變體。

訓練過程中,模型可以訪問每個樣本中的輸入輸出信息和程序前綴,但看不到程序執(zhí)行的完整軌跡和中間狀態(tài)

除了訓練集,作者還構建了一個包含1萬個樣本的測試集,用于評估模型的泛化性能。

為了研究語言模型是否掌握了代碼背后的語義,同時深入了解模型的“思維過程”,作者設計了一套包含線性分類器和單/雙隱層MLP的探測器組合。

探測器的輸入是語言模型在生成程序tokens過程中的隱藏狀態(tài),預測目標則是程序執(zhí)行的中間狀態(tài),具體包括機器人的朝向(direction)、相對于初始位置的偏移量(position)以及是否正面朝向障礙物(obstacle) 這三個特征。

在生成模型的訓練過程中,作者每隔4000步記錄一次上述三個特征,并同時記下生成模型的隱藏狀態(tài),形成探測器的訓練數(shù)據(jù)集。

圖片

大模型學習的三個階段

通過觀察語言模型產生的程序的多樣性、困惑度等指標隨訓練進程的變化,作者將訓練過程分為了三個階段——

  • Babbling(胡言亂語)階段:輸出程序重復度高,探測器準確率不穩(wěn)定。
  • 語法習得階段:程序多樣性迅速提高,生成準確率小幅提升,困惑度下降,說明語言模型習得了程序的句法結構。
  • 語義習得階段:程序多樣性和句法結構掌握程度平穩(wěn),但生成準確率和探測器性能大幅提升,說明語言模型習得了程序的語義。

具體來說,Babbling階段占據(jù)了整個訓練過程的前50%,例如在訓練到20%左右的時候,無論輸入什么規(guī)范,模型都只會生成一個固定的程序——“pickMarker”重復9次。

語法習得階段處于訓練過程的50%到75%,模型在Karel程序上的困惑度顯著下降,表明語言模型開始更好地適應Karel程序的統(tǒng)計特性,但生成程序的準確率提升幅度不大(從10%左右提升到25%左右),仍然無法準確完成任務。

語義習得階段是最后的25%,程序的準確率出現(xiàn)了急劇提升,從25%左右提升到90%以上,生成的程序能夠準確地完成給定的任務。

圖片

進一步實驗又發(fā)現(xiàn),探測器不僅可以對t時刻的同時間步進行預測,還能預測后續(xù)時間步的程序執(zhí)行狀態(tài)

舉例來說,假設生成模型在t時刻生成了token“move”,并將在t+1時刻生成“turnLeft”。

與此同時,t時刻的程序狀態(tài)是機器人面向北方,位于坐標(0,0),而t+1時刻機器人將是機器人將面向西方,位置不變。

如果探測器能夠從語言模型在t時刻的隱藏狀態(tài)中,成功預測到t+1時刻機器人會面向西方,就說明在生成”turnLeft”之前,隱藏狀態(tài)就已經包含了這一操作帶來的狀態(tài)變化信息。

這一現(xiàn)象說明,模型并非只對已生成的程序部分有語義理解,而是在生成每一步時,就已經對接下來要生成的內容有所預期和規(guī)劃,顯現(xiàn)出了初步的面向未來的推理能力

但這一發(fā)現(xiàn)又給這項研究帶來了新的問題——

實驗中觀察到的準確度提升,到底真的是生成模型進步了,還是探測器自己推論的結果呢?

為了解決這個疑惑,作者補充了語義探測干預實驗

圖片

實驗的基本思路是改變程序操作的語義解釋規(guī)則,具體又分為“flip”和“adversarial”兩種方式。

“flip”是強行反轉指令含義,如將“turnRight”強行解釋為“左轉”不過能進行這種反轉的也只有“turnLeft”和“turnRight”;

“adversarial”則是將所有指令對應的語義隨機打亂,具體方式如下方表格。

圖片

如果生成模型的隱藏狀態(tài)只編碼了程序的句法結構,而非語義信息,那么探測器應該仍然能夠從隱藏狀態(tài)中以同等的性能去提取這些被改變的語義信息。

相反,如果探測器性能顯著下降,則說明探測器顯示出的的性能提升的確是因為生成模型隱藏狀態(tài)編碼了實際語義。

實驗結果顯示,在兩種新語義下,探測器的性能都出現(xiàn)了顯著下降。

尤其是在“adversarial”模式下更加明顯,這也與該模式下的語義與原始語義差異更大的特征相一致。

圖片

這些結果有力地排除了探測器“自己學會語義映射”的可能性,進一步證實了生成模型的確掌握了代碼的含義。

論文地址:https://icml.cc/virtual/2024/poster/34849

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-10-11 12:32:53

AI模型

2025-05-29 08:30:00

LLM大語言模型AI

2023-09-20 08:00:00

大語言模型代碼庫

2025-06-10 09:04:00

2023-12-27 11:31:27

2025-04-22 08:08:37

2023-05-19 15:58:52

2025-04-01 09:54:09

AI算法大模型AI

2024-01-12 10:29:26

2023-11-03 07:47:12

機器資源大模型:

2024-04-11 11:35:03

大語言模型LLMs

2024-09-09 09:00:00

2024-03-19 13:12:36

自動駕駛模型

2025-05-07 09:12:00

模型研究LLM

2025-01-10 10:30:00

大模型統(tǒng)計評估

2023-10-05 13:33:53

AI訓練

2025-04-10 07:59:51

2024-06-06 08:06:19

鴻蒙大語言模型LLM模型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文字幕第一页在线 | 国产成人精品午夜 | 亚洲综合视频 | 成人一区二区三区在线观看 | 亚洲免费观看视频网站 | 欧美性大战xxxxx久久久 | 视频在线亚洲 | 四虎成人精品永久免费av九九 | 911网站大全在线观看 | 国产精品1区2区3区 男女啪啪高潮无遮挡免费动态 | 国产精品视频免费 | 亚洲日日夜夜 | 日韩欧美一级精品久久 | 蜜桃毛片 | 男人天堂午夜 | 国产精品美女一区二区三区 | 日韩二三区 | hdfreexxxx中国妞| 日韩电影一区 | 色999视频 | 日本精品视频一区二区 | 日韩午夜精品 | 久久精品国产99国产 | 天天射影院| 亚洲精品白浆高清久久久久久 | 天天躁日日躁狠狠躁2018小说 | 久久中文视频 | 欧美伊人久久久久久久久影院 | 亚洲一区三区在线观看 | 96久久久久久 | 夜夜爽99久久国产综合精品女不卡 | 青青草av | 久久剧场 | 欧美视频区 | 亚州av | 精品一区二区久久久久久久网精 | 国产精品久久久久久久久久妇女 | 国产一级淫片a直接免费看 免费a网站 | 久久久一区二区 | 男女午夜激情视频 | 日韩精品在线一区 |