成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

見證歷史!AI想的科研idea,真被人類寫成論文發表了

人工智能 新聞
今年8月,Sakana AI這家公司推出了史上首位“AI科學家”,且一登場就一口氣生成了十篇完整學術論文。

天啦擼!!AI想出來的idea,還真有人寫成論文了。

甚至預印本arXiv、博客、代碼全都有了。

今年8月,Sakana AI(由Transformer論文8位作者的最后一位Llion Jones創業成立)這家公司推出了史上首位“AI科學家”,且一登場就一口氣生成了十篇完整學術論文。

圖片

而現在,受其中一篇論文想法的啟發,人類研究員真的寫出相關論文并在arXiv上公開了。

OpenAI前研究團隊負責人Jeff Clune激動直言:

簡直不敢相信!這是它產生的我最喜歡的想法之一。看到與人類達成一致真是太酷了,人類確實執行得更好。

圖片

話不多說,讓我們來康康論文具體內容。

Claude提的idea,被人類寫成論文了

翻開“AI科學家”之前撰寫的論文,我們找到了Jeff Clune提到的這一篇。

《Grokking Through Compression: Unveiling Sudden Generalization via Minimal Description Length》
通過壓縮實現Grokking:借助最小描述長度(MDL)揭示突然泛化現象

圖片

根據描述,這篇論文的想法由Claude 3.5 Sonnet在第22次迭代時提出。

它主要探討了神經網絡中最小描述長度(MDL)與 “grokking” 現象(模型經長時間訓練后突然泛化)的關系,從信息論視角研究突然泛化的機制。

其中,MDL可以被看成一種衡量模型復雜度和可壓縮性的方法,即模型既要能夠很好地擬合數據,又不能過于復雜(避免過擬合)

具體而言,研究引入了一種基于權重剪枝的新型MDL估計技術,并將其應用于多種數據集,包括模塊化算術和排列任務。相關實驗揭示了MDL減少與泛化能力提高之間存在強烈的相關性(下圖),MDL的轉變點通常在“grokking”事件發生之前或與之同時出現。

此外,研究觀察到在“grokking”與非“grokking”情境下MDL演變模式的差異,前者以快速的MDL減少后持續泛化為特征。這些發現為理解“grokking”的信息論基礎提供了見解,并表明在訓練期間監控MDL可以預測即將發生的泛化

圖片

Okk,了解了原論文,我們再來看人類選手最新發表的內容。

圖片

概括而言,他們研究了神經網絡在 “grokking” 現象中的復雜性動態,即網絡從記憶訓練數據到實現完美泛化的過渡過程,并提出了一種基于失真壓縮理論的新方法來衡量神經網絡的復雜性。

首先,作者之一Branton DeMoss自述,他們受到了Sean Carroll和Scott Aaronson之前研究的啟發。

通過觀察咖啡與奶油混合的現象,Scott等人發現復雜性隨著時間的推移首先上升,然后下降,這一過程與熵單調增加的趨勢相似。

而DeMoss團隊形式化了這一直覺,并將其應用于神經網絡,以跟蹤這些網絡學習的抽象復雜度。

圖片

展開來說,作者們同樣先介紹了grokking現象,即神經網絡在長時間過度擬合訓練數據后突然能夠泛化的能力。

其中x軸表示優化步數,y軸表示準確率;紅線代表訓練集的準確率,綠線代表驗證集的準確率。

可以看到,如果訓練一個小型Transformer來進行模擬,在幾百個訓練步驟之后,模型已經完美地擬合了訓練數據;然而,它直到大約10^5個訓練步驟才能實現泛化。

圖片

為了解釋這一現象,團隊引入了一種基于失真壓縮和Kolmogorov復雜性的新方法來衡量神經網絡的復雜性,并通過這一框架追蹤了grokking過程中網絡復雜性的動態變化。

按照作者的比喻,這就像“神經網絡的JPEG”。

研究結果表明,網絡在從記憶到泛化的過渡中,其復雜性首先上升,隨后在泛化發生時下降

進一步地,研究發現如果神經網絡沒有任何形式的正則化(一種防止過擬合的技術),它將無法從記憶階段過渡到泛化階段,而是會無限期地保持記憶模式。

沒有正則化的反應:

圖片

有正則化的反應:

圖片

此外,作者指出傳統的復雜性評判標準(如參數數量和權重范數)并不能準確描述模型的復雜性,因為它們忽略了訓練過程中的變化。

對此,他們采用了最小描述長度(MDL)原則和Kolmogorov復雜度來定義和近似復雜性,并通過實驗驗證了這種方法,并強調了簡單模型在數據壓縮中的優勢。

最終,研究表明理解復雜性對預測模型泛化能力至關重要。

圖片

更多細節感興趣可以查閱原論文(地址文末)

可以看出,一個由AI最初提出的想法,最終由人類來完成了更細致的論證。

有網友就分析指出AI寫的那篇實驗結果不及人類研究員:

圖片

而之前撰寫過“AI科學家”總論文的共同一作Cong Lu也表示:

誰知道未來AI還會激發出哪些其他想法……

圖片

BTW,就在Sakana AI公布“AI科學家獨立生成10篇學術論文”的消息后,公司在9月份還拿到了一筆2億美元的A輪融資,里面還有英偉達的參與。

總之,AI以后不僅能自己寫論文,還能和人類搭配干活了。

論文:https://arxiv.org/abs/2412.09810
GitHub:https://github.com/brantondemoss/GrokkingComplexity
博客:https://brantondemoss.com/research/grokking/

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-03-13 09:16:25

2018-10-20 15:20:10

2024-03-29 10:39:56

ChatGPTGPTSAI

2019-04-19 13:05:04

2025-03-27 23:41:35

豆包搜索AI

2019-05-06 14:30:40

AI人工智能

2023-08-31 14:50:18

無人機Swift

2022-06-10 14:51:18

AI技術

2025-02-12 13:44:12

2023-12-16 09:45:56

論文GPT-4AI

2021-05-10 11:25:12

計算機互聯網 技術

2014-05-09 11:19:38

iOS移動互聯網

2023-09-25 09:51:18

AI算力

2021-09-30 09:34:15

人工智能AI深度學習

2023-08-11 13:27:00

AI論文

2023-08-04 13:46:37

2025-05-28 11:44:24

AI模型研究

2023-04-14 10:27:34

人工智能自動化

2025-05-21 06:58:03

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩免费视频一区二区 | 欧美专区在线 | 999观看免费高清www | 在线观看国产视频 | 春色av| 蜜桃视频在线观看免费视频网站www | av网站免费观看 | 亚洲精品性视频 | 国产视频观看 | 天天射天天干 | 成人永久免费视频 | 久国久产久精永久网页 | 一级二级三级在线观看 | 久久精品亚洲精品国产欧美kt∨ | 久久99精品久久久久久国产越南 | 亚洲一区二区三区在线视频 | 狠狠干美女 | 又爽又黄axxx片免费观看 | 亚洲综合色 | 午夜精品久久久久久久星辰影院 | 美女操网站 | 特黄特黄a级毛片免费专区 av网站免费在线观看 | 黄篇网址 | 一级片av | 中国美女一级黄色片 | 欧美久久一区二区三区 | 一区二区三区四区视频 | 亚洲国产精品第一区二区 | 免费观看一级特黄欧美大片 | 精品国产一区二区三区日日嗨 | 一区二区小视频 | 天天操人人干 | www.一级片 | 欧美黄色一区 | 欧美日韩一区在线观看 | 四虎在线观看 | 欧美老妇交乱视频 | 婷婷久久五月天 | 成人免费在线观看 | 搞黄视频免费看 | 国产情品 |