成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI「領悟」有理論解釋了!谷歌:兩種腦回路內部競爭,訓練久了突然不再死記硬背

人工智能
如為什么領悟所需的時間隨數據集大小的減小呈超指數級增長?為什么Cgen回路的學習速度慢?為什么在沒有權重衰減的情況下也會發生grokking?為什么在典型的機器學習訓練中沒有領悟現象?

谷歌PAIR團隊不久前撰文介紹了AI的“領悟” (Grokking)現象——

訓練久了突然不再死記硬背,而是學會舉一反三,有了泛化能力。

不出一個月,另一只團隊(主要成員來自DeepMind)表示,已經給出一個通用理論解釋——

領悟又稱延遲泛化,與AI內部兩種“腦回路”的競爭有關。

對此,有學者評價“我們需要更多這種對深度學習物理規律的研究,而不是去優化煉金術。”

AI的兩種腦回路

在先前的研究中,發現在“領悟”現象的作用下,就算只有5-24個神經元的模型也能擁有泛化能力。

新研究沿用了這種構建最小示例,以及大量做可視化的方法。

基于OpenAI在2020年一項對神經網絡內部機制之間相互作用的研究,團隊假設并驗證了模型內部有兩種算法回路(Circuits)。

  • 記憶回路Cmem,訓練時表現很好,但測試時表現不佳。
  • 泛化回路Cgen,訓練和測試階段表現都好。

通過改變數據集的大小和權重衰減的強度做實驗來觀察。

當訓練數據集增大時,Cmem回路的參數范數也更大,也就是在靠記憶的方式去存儲訓練集需要的信息量。

但Cgen的參數范數不隨訓練集大小變化,也就是獲得了類似“舉一反三”的泛化能力

那么,在什么條件下模型會發生整體的“領悟”現象呢?

來自兩種回路的之間競爭。

在訓練初期,直接死記硬背的速度更快,Cmem占據上風。

但隨著數據的增加,在梯度下降的作用下效率更高的Cgen會被加強。

也就是說,存在兩種不同的回路、他們之間有效率差和學習速度差是導致領悟發生的三大要素。

重新思考泛化

在更進一步的實驗中,團隊還根據這個理論成功演示了在一定條件下,已經“領悟”的模型也可以退化,出現“逆領悟”。

在新的小數據集上繼續訓練已領悟的模型時,測試精度突然變差,也就是在泛化之后的過擬合。

也可以精心調整出一個“半領悟”狀態。

當數據集的大小剛好在一個臨界值,讓Cmem和Cgen的效率相當,只對部分測試精度出現延遲泛化。

團隊認為,這種基于回路效率的分析為理解神經網絡的泛化提供了一種新的視角。

同時也提出了一些后續研究方向。

如為什么領悟所需的時間隨數據集大小的減小呈超指數級增長?為什么Cgen回路的學習速度慢?為什么在沒有權重衰減的情況下也會發生grokking?為什么在典型的機器學習訓練中沒有領悟現象?……

評論區有學者認為,研究這些基礎問題并不需要成千上萬塊H100。

GPU貧民也有機會為整個領域做出貢獻。

論文地址:https://arxiv.org/abs/2309.02390

參考鏈接:

[1]https://x.com/VikrantVarma_/status/1699823229307699305

[2]https://pair.withgoogle.com/explorables/grokking/

責任編輯:武曉燕 來源: 量子位
相關推薦

2023-08-14 08:15:44

谷歌模型

2020-07-02 09:47:40

人工智能技術教育

2025-02-14 10:23:00

LLM模型谷歌

2017-09-21 11:43:14

JavascriptHtml5Html

2024-07-02 13:30:50

2025-06-18 08:51:00

數據生成AI模型

2020-04-16 10:55:03

Java虛擬機字節碼

2024-07-23 09:26:20

2010-01-05 17:23:51

JSON建構

2014-04-28 16:13:11

Unix目錄結構

2010-07-19 14:07:09

Perl ->符號

2011-06-20 16:03:03

Qt 控件 鼠標

2021-07-26 14:14:40

VRAI人工智能

2021-02-24 13:51:45

BIMAI建筑技術

2022-05-26 23:14:26

原型原型鏈JS繼承

2022-06-07 10:28:53

云遷移云計算

2022-11-17 08:47:20

Go特性標準庫

2021-04-01 17:43:49

iOS 14.5蘋果Siri

2024-11-04 15:54:16

2023-12-13 08:47:13

編程語言編譯型解釋型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人福利影院 | 日韩一区二区三区四区五区六区 | 久久的色 | 综合激情久久 | av一区在线观看 | 欧美日韩中文在线 | 日韩亚洲视频在线 | 亚洲欧洲视频 | 九九热热九九 | 在线中文视频 | 天天看天天摸天天操 | 中文字幕乱码视频32 | 日韩一区二区免费视频 | 欧美精品一区在线 | 男人的天堂久久 | 日韩电影免费在线观看中文字幕 | 久久久久久久久久久蜜桃 | 欧美精品在线免费观看 | 99精品国产一区二区三区 | 国产精品久久久久免费 | 亚洲三级免费看 | 视频在线一区二区 | 久草电影网 | 免费在线观看一区二区 | 国产一区二区三区在线看 | 精品久久久久久国产 | 国产精品1区 | 中文字幕一区在线观看视频 | 午夜国产一级 | 嫩草伊人 | 亚洲一区二区日韩 | 免费在线a视频 | 亚洲一区视频 | 日本一区二区三区四区 | 日本中文字幕在线观看 | 日韩一区二区在线视频 | 成人影院一区二区三区 | 日韩aⅴ片 | 国产999精品久久久久久 | 亚洲人成人网 | 欧美一区二区三区在线视频 |