成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Nature:神經網絡“舉一反三”能力甚至超人類

人工智能
Nature的這篇文章中表示,研究人員用一種叫做MLC的方法,通過在動態變化的組合任務流中訓練,神經網絡可以獲得人類般的組合推理能力。

神經網絡具有類似人的“舉一反三”能力,甚至超過人類水平???

最近刊于Nature的一篇論文表示找到了證據。

圖片

“舉一反三”的能力更專業點叫做系統性泛化能力。像小孩子一樣,一旦學會了如何“跳”,他們就可以理解如何“向后跳”、“繞錐體跳過兩次”。

要知道,早在1988年,認知科學家Fodor、Pylyshyn就提出了系統性挑戰,認為人工神經網絡缺乏這種能力。

Nature的這篇文章中表示,研究人員用一種叫做MLC的方法,通過在動態變化的組合任務流中訓練,神經網絡可以獲得人類般的組合推理能力。

他們還將MLC和人類在相同的系統性泛化測試中進行了比較。結果機器學習的系統性泛化基準測試表明,MLC錯誤率不到1%,并且還可以模擬人類的認知偏見導致的錯誤。

相比之下,GPT-4 在相同的任務中平均失敗率在42%到86%之間,具體取決于研究人員如何提出任務。

挑戰已存在35年的觀點

35年前,認知科學家Fodor、Pylyshyn提出了一個著名的觀點:

人工神經網絡由于缺乏組合性,不太可能成為合理的認知模型。

換句話說,人類語言和思維的精髓在于系統性組合,而神經網絡只能表示特定的事物,缺乏這種系統性組合能力。

這個觀點引發學界激烈討論。其中反駁觀點主要集中于兩個方面。

一是盡管人類的組合技能很重要,但它們可能并不具有Fodor、Pylyshyn所說的那樣的系統性和規則性。

二是雖然神經網絡在基本形式上受到了限制,但使用復雜的架構可以增強系統性。

雖然最近幾年,神經網絡在自然語言處理等方面有了很大進展和突破,相關辯論也隨之升級。

但時至今日,系統性的問題仍沒有一個定論。

基于此,紐約大學心理與數據科學助理教授Brenden M. Lake、西班牙加泰羅尼亞研究所(ICREA)研究教授Marco Baroni提出了一種叫做MLC(meta-learning for compositionality)的元學習神經網絡模型。

具體來說,用的是一種通過特殊指導和人類示例來指定模型行為的方法,然后要求神經網絡通過元學習獲得正確的學習技巧。

研究人員還表示,MLC使用的是標準的Seq2Seq架構,常見的神經網絡并沒有添加符號機制,也沒有手動設計內部表示或歸納偏見。

舉個例子來說明訓練過程。如下圖所示,給神經網絡模型一個“連續跳躍兩次”(skip twice)的指令。并用箭頭和小人來展示學習示例,告訴機器jump(跳)、skip(跳過)、jump twice是怎樣的。

然后將輸出的skip twice和行為目標比較:

圖片

類似情境,引入下一個詞“向后踮腳尖繞過一個錐體”,要求神經網絡組合向后走(walk backwards)、踮腳尖(tiptoe)、繞錐體行走(walk around a cone)的動作,推出如何“向后踮腳尖繞過一個錐體”。

圖片

機器VS人類

為了展示MLC方法的性能,研究人員對人類和機器在相同的系統性泛化測試中進行了評估。

實驗基于一個少樣本學習偽語言任務進行,其中詞匯與特定的符號或顏色有關。

比如給出基本詞匯,“dax”是紅色,“wif”是綠色,“lug”是藍色。

圖片

還有三個Function。Function 1中,“lug fep” 代表三個藍色的連續圈圈,“dax fep” 代表三個紅色的連續圈圈。

Function 2代表的是交替,像“lug blicket wif” 代表藍綠藍三個顏色的圈圈。

Function 3代表把輸出順序倒過來,像“dax kiki lug” 代表藍紅(根據基本詞匯應該是紅藍)。

還可以組合不同的Function,比如“wif blicket dax kiki lug”是藍綠紅綠。

圖片

△MLC架構

然后研究人員對25名人類的反應和機器的反應進行了比較:

圖片

研究人員還測試了在不給出任何示例的情況下,人類和機器歸納這種方法后的輸出,為的是測驗人類的歸納偏見:

圖片

測試后的結果表明,人類能夠系統性地泛化,正確率約為80%,但也存在一些偏見。

而使用MLC方法機器可以達到或超過人類的系統性泛化水平。

MLC還可以預測哪些指令對人們來說更容易或更難。

下圖展示了模型預測人類行為的log-likelihood值(用來判斷模型預測數據的好壞),數值越大表示模型的預測越準確:

圖片

研究人員還在兩個常見的機器學習的系統性泛化基準測試SCAN、 COGS中,著重關注MLC處理新單詞和單詞組合方面的表現,結果顯示錯誤率不到1%。

圖片

△在機器學習基準測試中進行系統性詞匯泛化的錯誤率

他們還表示,在純粹的代數推理和模擬人類復雜組合行為的情況中,MLC還可以模擬人類的認知偏見導致的錯誤模式,這說明神經網絡是一種很好的建模工具。

引發熱議

美國圣達菲研究所的計算機與認知科學家Melanie Mitchell表示:

這項研究是一個有趣的原理證明,但這種訓練方法是否可以擴展到更大的數據集甚至圖像,還有待觀察。

德國奧斯納布呂克大學自然語言處理專家Elia Bruni表示:

這項研究可以使神經網絡更高效地學習,將減少像ChatGPT等所需的訓練數據量,并減少“幻覺”。

將系統性注入神經網絡是一件大事,它可以同時解決這兩個問題。

但也有網友指出:

人類的溝通是多樣且多層次的,可以從太多角度總結 ,所以有必要持合理的懷疑態度,同時還需要證據和測試結果。

圖片

還有網友表示用這種方法能夠擊敗GPT-4是因為提示的問題:

我覺得一名高級的提示工程師使用GPT-4可以達到正確率85%的效果?!案鶕芯咳藛T如何呈現任務,準確率在42%到86%之間”這話確實會讓人產生疑慮。

考慮到主觀因素,希望他們能展示是如何提出這個任務的,至少比只給一句話要詳細。

圖片

論文鏈接:https://www.nature.com/articles/s41586-023-06668-3。

參考鏈接:
[1]https://www.nature.com/articles/d41586-023-03272-3。
[2]https://news.ycombinator.com/item?id=38017146。

責任編輯:姜華 來源: 量子位
相關推薦

2023-10-27 09:13:00

訓練模型

2023-12-06 13:39:00

模型訓練

2010-09-13 13:13:06

無線網絡穩定性

2010-03-25 11:16:47

2020-10-06 19:05:09

神經網絡人類思維人工智能

2025-02-25 14:13:31

2018-07-03 16:10:04

神經網絡生物神經網絡人工神經網絡

2021-07-07 10:57:08

神經網絡AI算法

2019-10-22 15:19:27

AI 數據人工智能

2019-11-19 08:00:00

神經網絡AI人工智能

2017-08-11 17:44:31

人工智能神經網絡神經元

2024-01-26 08:49:47

ChatGPT搜索方式

2021-11-01 12:32:08

量子芯片神經網絡

2018-07-29 06:46:07

神經網絡RNN循環神經網絡

2022-06-06 13:05:32

神經網絡宇宙

2017-08-09 16:32:40

人工智能深度學習機器人

2017-07-07 15:46:38

循環神經網絡視覺注意力模擬

2019-02-14 15:06:50

AI人工智能臨床診斷

2017-06-25 16:04:56

神經網絡人類視覺信號

2018-04-08 11:20:43

深度學習
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 毛片软件 | 91人人在线 | 国产精品久久久久久久久久妇女 | 午夜精品一区二区三区免费视频 | 最新日韩av | 在线观看特色大片免费网站 | 国产精品www | 国产日韩久久久久69影院 | 91精品久久久久久久久中文字幕 | 久久国产成人精品国产成人亚洲 | 狠狠久| 精品国产一区久久 | 久久区二区 | 精品久久久久久 | 日韩欧美天堂 | 欧美激情精品久久久久 | 欧美激情一区二区 | 久久日韩粉嫩一区二区三区 | 久久久久免费精品国产小说色大师 | 九九热在线精品视频 | 国产欧美一区二区在线观看 | 精品成人佐山爱一区二区 | 国产探花在线精品一区二区 | 免费激情 | www.99热这里只有精品 | 精品视频在线免费观看 | 国产精品一区二区福利视频 | 久久久久久免费看 | 精品成人| 久久久精彩视频 | 日韩午夜场| 自拍偷拍3p| 欧美综合一区 | 欧美三级免费观看 | 九九爱这里只有精品 | 欧美日韩视频在线 | 浴室洗澡偷拍一区二区 | 亚洲精品视频网站在线观看 | 欧美亚洲高清 | 成人超碰 | 国产精品欧美一区二区三区不卡 |