成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

35年首次證明!NYU重磅發(fā)現(xiàn)登Nature:神經(jīng)網(wǎng)絡(luò)具有類人泛化能力,舉一反三超GPT-4

人工智能 新聞
Nature刊登了紐約大學等機構(gòu)的研究人員在人工智能領(lǐng)域最新突破,證明神經(jīng)網(wǎng)絡(luò)具有類似人類語言的泛化性能,再一次印證了AI發(fā)展的無限潛力!

35年來,認知科學、人工智能、語言學和哲學領(lǐng)域的研究人員一直在爭論神經(jīng)網(wǎng)絡(luò)是否能實現(xiàn)類似人類的系統(tǒng)泛化。

具體來說,人們一直認為,AI無法像人類一樣具有「系統(tǒng)泛化(systematic generalization)」能力,不能對沒有經(jīng)過訓練的知識做到「舉一反三」,幾十年來這一直被認為是AI的最大局限之一。

最近,NYU和西班牙龐培法布拉大學的研究者首次證明——它可以!

他們在這個方向取得了里程碑式的突破,論文已經(jīng)刊發(fā)在了Nature上。

論文鏈接:https://www.nature.com/articles/s41586-023-06668-3#auth-Brenden_M_-Lake-Aff1

研究人員提出了一種新的神經(jīng)網(wǎng)絡(luò)訓練方法——MLC(Meta-Learning for Compositionality),能夠大幅提高神經(jīng)網(wǎng)絡(luò)「舉一反三」的能力,甚至能夠超越人類!

人類之所以能夠做到舉一反三,快速掌握復雜語言的含義或者某種技巧,是因為人類天生具有「系統(tǒng)泛化」的能力。

舉個例子,如果我們從未聽過「秦始皇戴小紅帽——贏到姥姥家了」這個短語,但知道「秦始皇叫嬴政」,知道「小紅帽」的故事,就能理解這個歇后語,還能把它用在正確的地方。

但就算是「先進如GPT-4」的AI模型卻還是無法理解這個歇后語,即使他知道「秦始皇叫嬴政」,以及「小紅帽」的故事。

研究人員通過一種新的神經(jīng)網(wǎng)絡(luò)訓練方法——MLC在變化的任務(wù)環(huán)境中訓練模型,使模型逐步獲得組合詞匯含義的系統(tǒng)性推理能力。

結(jié)果表明,MLC模型不僅可以做出符合邏輯的響應(yīng),還能捕捉人類偏差性錯誤的規(guī)律,在人機對比中展現(xiàn)出驚人的人類化思維。

甚至,通過MLC訓練出來的模型,系統(tǒng)泛化能力已經(jīng)碾壓了GPT-4。

論文作者同時還強調(diào),如果孩子們在自然成長的體驗中也有類似MLC這樣的組合和激勵機制,就可以解釋人類的系統(tǒng)性泛化能力的來源。

這項研究可能會對人工智能和認知科學都產(chǎn)生深遠影響。

它表明合適的方法可以讓標準神經(jīng)網(wǎng)絡(luò)獲得人類語言思維的核心特征——系統(tǒng)性復合推理能力。

盡管當今最強大的AI模型(例如 ChatGPT)可以在許多對話場景中發(fā)揮作用,但在對未訓練過的知識的理解能力上,仍然存在不足。

某種程度上導致了模型「幻覺」問題一直無法有效解決。

針對LLM的局限,作者強調(diào),「研究通過MCL來解鎖了系統(tǒng)性泛化(SG)的更加強大的能力之后,也可能幫助大語言模型來克服自身固有的缺陷。」

理解系統(tǒng)性泛化(Understanding Systematic Generalization)

這一突破性的研究在于系統(tǒng)性概括的概念。當我們?nèi)祟愒诓煌沫h(huán)境時,擁有毫不費力地適應(yīng)和使用新學單詞的能力。

例如,「Photobomb」是一個英語俚語,指的是在拍照時突然出現(xiàn)在照片中,通常是有意而為之,以吸引注意力或制造幽默效果。

一旦我們理解了「Photobomb」這個詞,我們就會本能地知道如何在各種情況下使用它,無論是「兩次Photobomb」還是「在使用Zoom期間進行Photobomb」。

同樣地,當人類理解「狗追貓」這樣的句式結(jié)構(gòu)之后,可以輕松掌握「貓追狗」的含義。

然而,人類固有的舉一反三的理解和泛化能力,對于人工智能來說一直是具有挑戰(zhàn)性的前沿領(lǐng)域。

傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)是AI研究的支柱,但是它不具備理解和泛化能力,神經(jīng)網(wǎng)絡(luò)只會努力合并一個新單詞,否則需要靠大量的樣本進行廣泛的訓練。

幾十年來,這種受限的泛化性一直是AI研究人員爭論的話題,關(guān)于神經(jīng)網(wǎng)絡(luò)作為人類認知過程的真實反應(yīng)是否可行,引發(fā)了大量的討論。

在本文中,研究人員提供了證據(jù),證明神經(jīng)網(wǎng)絡(luò)可以通過研究人員提出的MLC(Meta-Learning for Compositionality)系統(tǒng)實現(xiàn)類似人類的系統(tǒng)泛化。

MLC 是研究人員提出的一種優(yōu)化程序,旨在通過一系列少樣本合成任務(wù)來激勵系統(tǒng)性(如下圖1)。

研究人員展示了MLC如何通過實踐來提高神經(jīng)網(wǎng)絡(luò)的組合技能(Compositional Skills)。

MLC獲得一個新詞(或規(guī)則系統(tǒng))并嘗試系統(tǒng)地使用它。在不斷地修正和更新「理解」之后,可以對下一個新詞重復該過程。

研究人員構(gòu)建的MLC只使用了常見的神經(jīng)網(wǎng)絡(luò),沒有添加符號機制,也沒有手工設(shè)計的內(nèi)部表示或歸納偏差。

相反,MLC提供了一種通過高級指導和/或直接人類示例來指定所需行為的方法;然后要求神經(jīng)網(wǎng)絡(luò)通過元學習(Meta Learning)來培養(yǎng)正確的學習技能。

為了證明MLC的能力,研究人員在相同的系統(tǒng)泛化測試中并排對比評估了人類和機器的能力。

具體來說,研究人員,在偽語言(pseudolanguage)指令學習任務(wù)中使用代數(shù)或數(shù)學概念,以測試人類和機器學習系統(tǒng)對這些概念的理解和應(yīng)用能力。

還研究了人們對高度模糊語言的探測反應(yīng)。這些語言探測的設(shè)計目的是了解人類在面對模糊信息時的傾向或偏差。

即人類如何進行歸納推理,以及這些傾向或偏差是如何可能促進或者阻礙系統(tǒng)性泛化。

在對結(jié)果進行了評估之后,研究人員發(fā)現(xiàn),MLC實現(xiàn)(甚至超過)人類水平的系統(tǒng)泛化!

當人類行為偏離純粹代數(shù)推理時,MLC 還會產(chǎn)生類似人類的錯誤模式。

這表明神經(jīng)網(wǎng)絡(luò)是一種卓越的建模工具,可用于細致入微的人類組合行為。

在最后一組模擬中,研究人員展示了 MLC 如何提高流行基準的準確性,以實現(xiàn)少樣本系統(tǒng)泛化。

研究細節(jié)(The Study in Detail)

為了更深入地研究神經(jīng)網(wǎng)絡(luò)的功能及其語言泛化的潛力,作者進行了全面系統(tǒng)的實驗,其不僅研究了機器,25名人類也交叉地參與其中,以此作為AI的表現(xiàn)基準。

在實驗中使用了一種偽語言,即參與者不熟悉的單詞,這樣能夠確保參與者真正第一次學習這些術(shù)語,從而為測試泛化性能提供一個可信的baseline。

如上圖(左側(cè)),原始類別包括「dax、wif、lug」等單詞,它們象征著類似于「jump、skip」跳過與跳躍的基本動作(下圖左側(cè))。

另一方面,使用更抽象的功能詞,比如「blicket、kiki、feg」,為之前的原始詞術(shù)語的應(yīng)用和組合制定了規(guī)則,從而推斷出「skip twice、walk backwards」等序列。

在培訓參與者的過程中還引入了視覺元素,每一個原始單詞都與特定顏色的圓圈相關(guān)聯(lián)。

例如,如下圖,紅色圓圈代表「dax」,而藍色圓圈代表「lux」。

制定好顏色單詞映射規(guī)則后,接下來,向參與者展示原始語和功能詞的組合,并附帶彩色的圓圈圖案。

例如,一個短語「fep」與三個紅色圓圈配對,說明「fep」可能代表一個動作的三次重復。

此外,為了衡量參與者的理解能力和系統(tǒng)性的概括能力,還向它們展示了原始詞和功能詞的負責組合。參與者的任務(wù)是準確地推斷出圓圈的顏色和數(shù)量,并進一步給出正確的排列順序。

影響力和專家意見(Implications and Expert Opinions)

這項研究不僅僅是人工智能研究史冊上的又一個增量,還代表了范式的轉(zhuǎn)變。

神經(jīng)網(wǎng)絡(luò)的性能密切反映了類人系統(tǒng)的泛化能力,這引起了廣泛學者和行業(yè)專家的關(guān)注。

著名約翰霍普金斯大學語言專業(yè)認知科學家Dr. Paul Smolensky表示:

「在訓練過程中能讓網(wǎng)絡(luò)擁有系統(tǒng)化能力的重大突破。」

如果可以訓練網(wǎng)絡(luò)進行系統(tǒng)泛化,那么這些模型就可能徹底改變聊天機器人、虛擬助手等諸多應(yīng)用程序。

然而,這種發(fā)展不僅僅是技術(shù)的進步,它還觸及了AI界長期存在的爭論:

「神經(jīng)網(wǎng)絡(luò)是否真的可以視作準確模擬人類認知的工具?」

在過去的近四十年里,這個問題一直是AI研究者們爭論不休的焦點。盡管有些人相信神經(jīng)網(wǎng)絡(luò)有潛力模擬類似人類思維過程,但另一些人依然對它們的天生局限表示懷疑,特別是在語言泛化領(lǐng)域。

這項研究的結(jié)果帶來了新的希望,使人們變得更加樂觀。

正如紐約大學認知計算科學家、該研究的共同作者Brenden Lake所指出的,神經(jīng)網(wǎng)絡(luò)過去可能一直在取得艱難的進展,但通過正確的方法,它們確實可以被調(diào)整和訓練,以更好地反映人類認知的各個方面。

邁向人機無縫協(xié)同的未來

AI從起初的萌芽階段到如今強大,經(jīng)歷了不斷地演化和突破。最近在訓練神經(jīng)網(wǎng)絡(luò)系統(tǒng)的概括語言方面取得的成就再次證明AI的無限潛力。

當我們處于這個關(guān)頭時,有必要認識到這些進步的廣泛應(yīng)用。

我們正一步步接近未來:機器不僅能理解人類的的語言,還能掌握細微的差別和語義,從而促進更加無縫和直觀的人機交互未來。

責任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2023-10-26 20:14:28

Nature神經(jīng)網(wǎng)絡(luò)

2024-01-02 09:05:58

科學AI

2024-05-27 00:00:00

2021-08-10 06:18:39

SpaceXSwarm衛(wèi)星通信

2024-01-30 20:08:07

谷歌GPT-4Bard

2021-03-31 13:11:00

智能家居物聯(lián)網(wǎng)

2021-01-17 08:19:35

微信移動應(yīng)用公眾號

2021-01-27 13:35:01

比特幣金融貨幣

2023-06-19 08:19:50

2011-05-24 09:46:38

2022-02-23 09:27:37

神經(jīng)網(wǎng)絡(luò)人工智能模型

2010-09-13 13:13:06

無線網(wǎng)絡(luò)穩(wěn)定性

2025-04-16 09:35:03

2023-11-16 15:57:00

數(shù)據(jù)訓練

2012-05-24 10:18:24

智能手機3G

2023-03-29 14:58:04

GPT-4技術(shù)

2023-04-07 09:18:33

AI神經(jīng)網(wǎng)絡(luò)

2023-08-27 14:44:04

代碼編程語言

2023-10-30 10:58:57

2024-05-21 12:23:17

點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产一区亚洲 | 一级免费在线视频 | 日韩有码一区 | 亚洲一级视频在线 | 欧美一级大片免费看 | 91久久精品国产免费一区 | 欧美黄色录像 | 伊人焦久影院 | 亚洲成人av在线播放 | 黄色国产大片 | 日韩小视频在线 | 日韩一区二区三区精品 | 中国大陆高清aⅴ毛片 | 欧美一级在线观看 | 欧美日韩一 | 97起碰| 久久精品成人热国产成 | 精品中文视频 | 亚洲一区二区免费 | 精品在线一区二区 | 毛色毛片免费看 | 日韩一区二区三区在线 | 美女在线一区二区 | 久久黄网 | 欧美激情综合网 | 久久国产精品无码网站 | 欧美午夜一区 | 亚洲日韩第一页 | 日韩视频―中文字幕 | 亚洲成人一区二区三区 | 2019天天操| 91五月婷蜜桃综合 | 91精品一区二区三区久久久久久 | 日韩免费一区二区 | 高清视频一区二区三区 | 亚洲 欧美 日韩 在线 | 久久久人成影片一区二区三区 | 日韩在线看片 | 美女久久 | 最新中文字幕久久 | 国产亚洲精品久久情网 |