超越 GPT-3,DeepMind 推出新寵 Gato,卻被質(zhì)疑「換湯不換藥」
受大規(guī)模語言建模的啟發(fā),Deepmind應用類似的方法構建了一個單一的「通才」智能體 Gato,它具有多模態(tài)、多任務、多具身(embodiment)特點,能夠執(zhí)行600多個不同的任務。而這款人工智能,可以說是世界上迄今為止最令人印象深刻的一體式機器學習套件。
DeepMind在官方博客中解釋道:
“Gato是作為一個多模式、多任務、多組件的通用人工智能。在相同的網(wǎng)絡條件下可以玩雅達利游戲、給圖像加標題、與人聊天,以及控制機械臂堆積木等等,它會根據(jù)當前情境決定是否輸出文本、轉(zhuǎn)動機械手臂、按下按鈕或是進行其他標記。”
雖然Gato的表現(xiàn)究竟如何還有待觀察,但它似乎比GPT-3所希望實現(xiàn)的一切還要多。
圖片來源:DeepMind官網(wǎng)
Gato真的超越了GPT-3嗎?
GPT-3是一個大型語言模型(LLM),由資金充足的人工通用智能(AGI)公司OpenAI制作。它不僅有來自微軟的數(shù)十億美元的支持,在美國政府的監(jiān)管方面還基本上允許它做任何事。
它所專注于研究的通用人工智能(AGI)是一種具有人類智慧、可以執(zhí)行人類能夠做的任何智力任務的人工智能。一些研究人員將通用人工智能稱為強AI(strong AI)或者完全AI(full AI),或稱機器具有執(zhí)行通用智能行為(general intelligent action)的能力。與弱AI(weak AI)相比,強AI擁有全方位的人類認知能力。
最初,OpenAI的使命是開發(fā)和控制一個AGI,但現(xiàn)實是,該公司設法創(chuàng)造的所有東西都是非?;ㄉ诘腖LM,這與它的“初心”有些背道而馳了。
盡管GPT-3和DeepMind的Gato一樣令人印象深刻,但大眾對它們的評價標準需要一些細微的差別。
因為OpenAI在通往AGI的道路上走的是LLM路線,其中的原因很簡單:沒有人知道如何讓AGI工作。就像從“火的發(fā)現(xiàn)”到“內(nèi)燃機的發(fā)明”之間花了許多時間一樣,弄清楚如何從深度學習到AGI也不會在一夜之間發(fā)生。不過,GPT-3還是可以做一些看起來像是人類做的事情,例如生成文本。
而標榜自己是“通用人工智能”的Gato所做的幾乎是與GPT-3相同的事情。它只把一個工作原理很像LLM的東西整合成了一個能夠變600多種戲法“魔術師”。其亮點是使用單一序列模型解決所有任務,但卻需要增加訓練數(shù)據(jù)的數(shù)量和多樣性。
Gato執(zhí)行多種任務的能力更像是一個可以存儲600種不同游戲的游戲機,而不是像一個你可以用600種不同方式玩的游戲。它并不如介紹所說,是一個通用人工智能,而是由一堆預先訓練好的、狹窄的模型整齊地捆綁在一起所組成。
圖片來源:DeepMind官網(wǎng)
正如Knives and Paintbrushes研究小組的Mike Cook最近同TechCrunch的Kyle Wiggers所說的那樣:
“像Gato這樣的人工智能能夠完成所有這些聽起來非常不同的任務,這很令人興奮,因為對我們來說,寫文字和控制機器人聽起來非常不同。
但實際上,這與GPT-3理解普通英文文本和Python代碼并無太大區(qū)別。
并不是說這很容易實現(xiàn),但對外部觀察者來說,這或許聽起來像是人工智能還能泡茶或輕松地學習另外十項或五十項任務,然而事實上,它不能做到這這些。”
總而言之,Gato和GPT-3都是強大的人工智能系統(tǒng),但它們都不具備通用智能的能力。
AGI時代何時到來?
DeepMind已經(jīng)在AGI方向上發(fā)展了十多年,OpenAI則是從2015年開始。但兩者都沒能解決解決AGI道路上的第一個問題:建立一個無需訓練就能學習新事物的AI。
除非你賭AGI的出現(xiàn)是運氣所產(chǎn)生的結果,否則,是時候該重新評估這些公司對AGI領域的推進進程了。
或許,Gato可能是世界上最先進的多模態(tài)人工智能系統(tǒng)。但DeepMind采用了和OpenAI一樣的讓AGI走向死胡同的概念,只是讓它更有市場。
Gato或許能通過營銷手段在消費者市場上贏得比Alexa、Siri或谷歌助手更多的青睞。但是,Gato和GPT-3并不是比上述虛擬助手更可行的AGI入門點。
如果這正是你正在尋找的一類人工智能,那么這并不是一件壞事。但是,在Gato的附帶研究論文中,根本沒有任何證據(jù)表明它在往AGI的正確方向上發(fā)展,更不用說是AGI的一塊墊腳石了。