成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

強化學習之父:LLM主導只是暫時,擴展計算才是正解

人工智能 新聞
大模型目前的主導地位只是暫時的,在未來五年甚至十年內都不會是技術前沿。

這是新晉圖靈獎得主、強化學習之父Richard Sutton對未來的最新預測。

就在剛剛的新加坡國立大學建校120周年(NUS120)之際,Sutton受邀發表演講——塑造AI和強化學習的未來。

圖片

其實,這已經不是Sutton第一次在公開場合表達類似的觀點,早在他19年的著作《痛苦的教訓》中,他就明確提出:

讓AI尤其是LLM模仿人類思維方式,只能帶來短期的性能提升,長期看只會阻礙研究的持續進步。

在他4月份新發表的論文《歡迎來到體驗時代》也再度強調了這點,同時他表示,擴展計算才是正解。

圖片

本次NUS120演講長達一個多小時,可謂是干貨滿滿、信息量超大。

讓我們一起來看看完整演講內容。

LLM主導是暫時的

Sutton首先提及當前人類處于數據時代,像ChatGPT這類大語言模型,都是靠分析人類產生的大量數據(如文本、圖像、視頻)進行訓練。

但始終追逐人類思維方式,至多也只能達到“人類水平”

在數學、科學等領域,人類數據里的知識已經接近極限,AI難以突破現有認知,純靠模仿已經很難再有創新。

圖片

AI需要新的數據來源,且要隨著AI增強而改進,靜態數據集顯然不足。

因此他認為AI終將從依賴人類數據,轉向通過Agent與世界的第一人稱交互,以獲取“體驗數據”的學習。

AlphaGo在與李在石對弈的第二局中,下出的神之一手——第37手,在人類標準下完全非常規的走法,就充分展現了AI在這種體驗學習下的思考潛力。

也就是說,AI將會在自主體驗中,完成自己的更新迭代,產生更高級的數據并反哺自身,構成一個“越學越強”的循環。

還能不受人類現有知識限制,自由探索人類未涉及的領域,比如全新的科學理論、材料設計等。

Sutton舉了個例子:

一個蹣跚學步的嬰兒會通過不斷探索周圍環境主動學習,然后隨著認知增長,每一次互動方式都會隨著經驗有所不同。

因此AI的未來將屬于通過互動和經驗學習的“體驗時代”,Agent需要從經驗中學習,而這遠遠超出了LLM的能力范疇。

即使現有LLM在連接全球知識上表現出色,但通往這一未來的核心路徑始終是強化學習。

強化學習正是圍繞著經驗學習構造,但要發揮強化學習全部潛力,還需具備持續學習能力的深度學習算法

圖片

而這背后要靠對大規模算力的充分利用來支撐,繼續基于搜索和學習擴展算力,以適應AI性能需求增加。

可以說,從長遠看,真正的突破還是來自規模計算

不同Agent去中心化互利共贏

談及Agent的前景,Sutton提出對不同目標的Agent可以尋求去中心化合作。

他認為每個Agent的獎勵信號都各不相同,且都試圖最大化自己的回報,那么只需要讓不同Agent各自實現其目標,再通過互動,就能實現互利共贏。

這就類似于人類社會中的經濟運轉,得益于自然語言和貨幣的發明,盡管人們擁有不同的目標和能力,但在過程中相互協調配合,也能產生出不錯的效果。

但還是有不少人主張集中控制AI,甚至呼吁暫停AI。

Sutton認為這種聲音更多的是來源于對未知的恐懼,要接受個體目標的多樣性,建立合作化秩序,AI的潛力恰恰就在去中心化合作。

圖片

另外,Sutton還提到了“設計時代”的概念,當前的機器越來越類生命化,而生命也被視作生物機器。

但生命與技術之間存在本質差異,生命是在無意識下被復制產生,而技術則先經設計師意識想象再落地創造,這是一個設計過程,且設計產物也更易改進。

因此人類發展AI,就是為了將設計做到極致——設計出能自主設計的Agent,而人類將會在設計時代扮演催化劑和創造者的角色,將AI視作推動發展的機遇,而非單純的技術產物。

One More Thing

Sutton的言論一出,很快在社區引起了激烈討論。

支持者認為技術的突破往往來自未知與偶然,技術已趨向成熟的LLM似乎即將觸及領域天花板。

圖片

而反對者則認為技術的發展在于不斷改進,也許LLM不是AI的最終形態,但它也必定在AGI發展過程中占據重要作用。

圖片

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-11-29 16:33:24

2025-05-28 02:25:00

2025-03-07 09:24:00

2025-06-05 06:36:17

2023-03-09 08:00:00

強化學習機器學習圍棋

2020-08-10 06:36:21

強化學習代碼深度學習

2025-03-25 09:12:00

LIMAI模型

2025-04-18 10:01:41

2025-02-10 13:50:00

算法模型訓練

2023-11-07 07:13:31

推薦系統多任務學習

2025-03-28 10:16:15

2024-11-01 09:39:26

強化學習AI

2024-09-30 14:40:00

AI強化學習框架

2024-09-13 06:32:25

2025-05-06 08:40:00

2022-11-02 14:02:02

強化學習訓練

2025-05-08 09:16:00

模型強化學習訓練

2021-09-17 15:54:41

深度學習機器學習人工智能

2021-12-06 17:38:51

強化學習工具人工智能

2020-11-12 19:31:41

強化學習人工智能機器學習
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美不卡| 国产a视频 | 黄色片av | 91精品国产91久久久久青草 | 亚洲瑟瑟 | 成人 在线 | 亚洲国产日本 | 国产精品69久久久久水密桃 | 日韩一区二区三区精品 | 日日草夜夜草 | 成人夜晚看av | 久久国产精品精品 | 中文字幕在线观看www | 夜夜夜久久 | 国产清纯白嫩初高生在线播放视频 | 日韩视频一区二区在线 | 999久久久免费精品国产 | 黄色国产视频 | 免费黄色a级毛片 | 黄色国产视频 | 国产91在线 | 中日 | 精品久久精品 | 成人av电影在线观看 | 看片91| 精品国产乱码久久久久久丨区2区 | 天天操天天射天天 | 丁香婷婷久久久综合精品国产 | 久久精品免费看 | 亚洲黄色一级 | 欧美精品日韩精品国产精品 | 欧美一区两区 | 羞羞色网站| 成人在线视频网 | 黄视频网址 | 久久综合一区 | 亚洲成人一区 | 亚洲第1页 | 免费在线观看成人av | 色眯眯视频在线观看 | 成人av一区二区三区 | 天堂中文av |