成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

首篇AI自寫論文通過ICLR 2025同行評審!6.25高分碾壓人類,AI獨挑科研大梁

人工智能 新聞
Sakana AI剛剛官宣,第二代「AI科學家」獨立完成論文,通過了ICLR 2025 Workshop的同行評審。這是首次完全由AI端到端生成的科學論文,獲得了學術高度認可。

首篇完全由AI生成的論文,竟通過了ICLR 2025同行評審!

剛剛,Sakana AI正式亮相AI Scientist-v2版本,直接踢破了AI頂會的大門。

從提出科學假設、設計實驗、到編寫代碼、運行實驗、分析數據、繪制圖表,再到撰寫完整論文,所有環節均由AI完成。

圖片

研究人員向2025 ICLR Workshop,一共提交了3篇AI生成的論文,全部進入雙盲評審。

顯然,審稿人完全不知道,他們評審的是AI生成的作品,并且按照評審人類科學家論文的標準,進行嚴格評判。

3篇論文中,只有一篇Compositional Regularization: Unexpected Obstacles in Enhancing Neural Network Generalization,平均獲6.25的高分(6,7,6,6),遠高于許多人類作者的論文。

圖片

論文地址:https://github.com/SakanaAI/AI-Scientist-ICLR2025-Workshop-Experiment/blob/master/compositional-regularization/annotated_paper.pdf

另外兩篇全部敗北。

圖片

Sakana AI特別強調,這是首次通過「與人類科學家相同標準」的同行評審論文。

AI科研歷史性時刻來了!

AI闖入科研殿堂,全程無人干預

要知道,ICLR與NeurIPS、ICML并稱機器學習和人工智能研究領域三大頂級會議。

如前所述,Sakana AI在由2025 ICLR主辦的Workshop——ICBINB上,展開了這項實驗。

這個研討會涉及的議題非常廣泛,挑戰者(包括AI科學家)需要處理多樣化研究課題,去解決深度學習的實際局限性。

圖片

https://sites.google.com/view/icbinb-2025

那么,AI論文是如何參與評審過程的呢?

評審過程

通過與ICLR Workshop商定,研究團隊提交了3篇AI生成的論文,參與同行評審。

審稿人并未明確被告知,他們所評審的論文是由AI生成的。在ICLR Workshop「評審指南」中,明確規定了這一點。

圖片

關鍵在于,Sakana AI提交的AI生成論文,完全由「AI端到端」生成,未經任何人類修改。

AI Scientist-v2不僅提出了科學假設,設計了測試假設的實驗,還編寫并優化了實驗代碼,運行實驗,分析數據,將數據可視化為圖表。

并且,它還撰寫了整篇科學稿件的每一個字,從標題到最后的參考文獻,包括圖表放置和所有格式。

全程沒有人類參與,為了監督研究,Sakana AI研究員僅是為AI提供了研究的廣泛主題,并提交了3篇他們自認為比較好的論文。

在提交的3篇論文中,其中兩篇未達到接受標準。

另外一篇論文的平均得分為6.25,在所有提交中排名約45%。這一分數高于研討會中許多被接受的人類撰寫論文,高于平均接受門檻。具體評分為:

  • 評分:6:略高于接受門檻
  • 評分:7:好論文,接受
  • 評分:6:略高于接受門檻
  • 評分:6:略高于接受門檻

圖片

對AI生成論文的分析

除了同行評審過程,作為人類AI研究者,Sakana AI還對所有3篇AI生成論文進行了自己的分析和評審。

團隊為每篇論文撰寫了全面的評審意見。

圖片

除了自己的評審之外,Sakana AI還為每篇AI生成的論文添加了內聯評論

他們扮演了ICLR會議審稿人的角色,向論文作者AI Scientist提出了自己發現的問題,并建議作者如何通過回應我們提出的問題改進論文。

與研討會評審過程不同,這種雙向交流是頂會或期刊典型同行評審過程的一部分,審稿人與作者共同改進作品。

如下圖所示,AI Scientist偶爾會犯令人尷尬的引用錯誤。

在這里,研究團隊發現它錯誤地將「基于LSTM神經網絡」引用寫成Goodfellow(2016),而正確的作者應是 Hochreiter 和 Schmidhuber(1997)。

圖片

除了評審和評論外,研究團隊還在初審階段,為每篇論文提供了初步評估分數,評估依據頂級ML會議(如NeurIPS、ICLR)的指南進行。

最終,他們得出結論:這3篇論文在其當前形式下,均未達到內部認為能被ICLR主會場接受的內部標準。

然而,他們認為提交至Workshop的論文能夠提出有趣、原創的初步想法,可以進一步的大發展,因此研究人員認為它們可能更適合ICLR Workshop分會場。

目前,Sakana AI已在GitHub倉庫中,公開了內部人類評審意見,以及這3篇AI生成論文。

圖片

項目地址:https://github.com/SakanaAI/AI-Scientist-ICLR2025-Workshop-Experiment?tab=readme-ov-file

AI中的不是主會,內部評審未通過

Sakana AI團隊坦承,目前AI生成的論文,在其內部標準下尚未達到ICLR主會場的接受水平。

在ICLR、ICML、NeurIPS三大頂會主場,接受率通常在20-30%之間,而ICBINB Workshop接受率在60-70%之間。

盡管這只是Workshop,而非主會場的成果,但這一里程碑式突破預示著更大變革即將到來。

在未來的研究中,團隊打算繼續改進流程,生成更高質量的科學論文,爭取通過頂級會議的標準。

Sakana AI還指出,AI Scientist主要基于當前最先進的LLM打造,因此其表現直接與這些LLM的性能相關。

如果前沿基礎模型得到持續改進,那么AI Scientist也將不斷提升。

主動撤回論文,科學規范不能破

值得一提的是,Sakana AI在進行這項研究時,高度重視透明度與倫理規范。

他們認為,科學界研究AI生成研究的質量非常重要,而最好的方法之一是,將少量樣本提交至與評估人類科學研究相同的嚴格同行評審過程(前提是已獲得管理這些過程的相關方許可)。

Sakana AI與ICLR組委會,以及Workshop組織者全面合作才展開的實驗,并獲得了不列顛哥倫比亞大學機構審查委員會(IRB)的批準。

此外,AI生成論文不會在OpenReview的公共論壇上公開。根據事先約定的實驗協議,Sakana AI主動撤回了被接受的論文。

這是因為,AI和科學界尚未決定是否希望在相同場合發表AI生成的稿件。

團隊認為,「作為一個共同體,我們需要制定關于AI生成科學的規范,包括何時以及如何聲明一篇論文由AI生成」。

「AI科學家」的未來

Sakana AI堅信相信,AI Scientist的下一代將開啟科學的新時代。

AI能夠生成一篇通過頂級ML Workshop同行評審的完整科學論文,展現了非常有前景的早期進展跡象。

但,這只是開始。

隨著AI繼續改進,AI Scientist的能力可能呈指數級增長。

在未來某個時候,AI很可能會生成達到甚至超越人類水平的論文,不僅能在頂級ML頂會上被接受,還能在頂級科學期刊中發表。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-05-16 13:50:34

ACL論文競爭

2025-05-19 08:54:00

2024-09-20 17:41:07

2024-12-18 13:30:00

2025-02-12 13:44:12

2025-02-20 13:50:00

AI生成訓練

2024-10-17 13:09:14

2024-05-09 11:24:20

AI論文

2024-03-25 07:15:00

AI模型

2019-10-31 14:37:55

技術人工智能開發

2025-03-03 08:50:00

AI目標檢測模型

2024-01-26 12:51:33

AI

2021-02-03 17:52:38

AI 數據人工智能

2023-12-16 09:45:56

論文GPT-4AI

2022-03-01 15:15:41

AI樂譜論文

2023-08-04 13:46:37

2024-03-29 10:39:56

ChatGPTGPTSAI

2025-04-04 00:00:00

AI模型數據

2020-10-18 18:02:32

AI機器學習微軟

2025-04-28 09:06:00

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产在线精品区 | 无码日韩精品一区二区免费 | 成人在线亚洲 | 一区二区成人 | 久久蜜桃精品 | 色欧美综合 | 久久久久国产一区二区三区不卡 | 亚洲国产成人精品久久久国产成人一区 | 亚洲a网| 中文字幕亚洲欧美日韩在线不卡 | 亚洲精品黄色 | 亚洲国产视频一区二区 | 国产亚洲精品久久久久久豆腐 | 久久九九网站 | 偷拍自拍网 | 国产精品综合视频 | 国产亚洲成av人在线观看导航 | 久久91av| 免费福利视频一区二区三区 | av在线天堂 | av在线免费观看网址 | 欧美在线一区二区三区 | 在线精品国产 | 日韩精品久久久久久 | 国产精品伦理一区二区三区 | 亚洲第一在线视频 | 日韩三级电影一区二区 | 一级在线视频 | 日本精品一区二区三区视频 | 欧美在线观看一区二区 | 人人玩人人添人人澡欧美 | 久久久久久久久久久久91 | 国产精品永久免费视频 | 免费观看一区二区三区毛片 | 新疆少妇videos高潮 | 天天夜夜操 | 天天看天天干 | 国产精品久久久久无码av | 免费在线观看成人 | а天堂中文最新一区二区三区 | 黄在线免费观看 |