成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

早半年發arXiv,卻被質疑抄襲:活在微軟AutoGen陰影里的CAMEL

人工智能 新聞
arXiv 不是同行評審期刊,所以發在 arXiv 上的論文不必被引用,這合理嗎?

如果你對 AI 智能體感興趣,那你一定知道微軟的 AutoGen。它是一個用于構建 AI 智能體的開源編程框架,允許多個智能體通過聊天來解決任務。其間,LLM 智能體可以扮演多種角色,如程序員、設計師,或者各種角色的組合。

在 GitHub 上,這個項目已經收獲了 28k 的 star 量,論文還在 ICLR 2024  LLM Agent Workshop 上獲得了最佳論文獎。

圖片

不過,這篇論文的背后其實是存在爭議的。

2023 年 11 月,一位 AI 研究者(阿卜杜拉國王科技大學博士,開源項目 Camel-AI.org、DeepGCNs.org 的發起人李國豪)發帖稱,由于 AutoGen 與他們的論文 CAMEL 高度相似,他們每次出席活動的時候都會被問,二者有什么區別?

圖片

圖片

對此,李國豪表示非常無奈,因為他們的論文發布在 arXiv 上的時間要明顯早于 AutoGen,如今卻被當成了 AutoGen 的模仿者(CAMEL 發布于 2023 年 3 月;AutoGen 發布于 2023 年 8 月)。

圖片

論文鏈接:https://arxiv.org/abs/2303.17760

圖片

論文鏈接:https://arxiv.org/pdf/2308.08155

根據李國豪的說法,二者在方法論上存在以下相似之處:

圖片

甚至用到的例子也有點相似:   

圖片

圖片

作為后來者,AutoGen 確實在論文中提到過 CAMEL,并指出了 CAMEL 與 AutoGen 之間的一些差異。但這些內容出現的位置令人費解 —— 它們統統出現在附錄中。這可能也是導致其他研究者只知 AutoGen,不知 CAMEL 的一大原因。畢竟,有幾個人會去仔細看附錄呢?

圖片


AutoGen 論文中提及 CAMEL 的段落:「CAMEL(Li et al., 2023b)是一個通信智能體框架,它展示了如何使用角色扮演來讓聊天智能體相互交流以完成任務。CAMEL 還能記錄智能體對話以進行行為分析和能力理解。CAMEL 使用了一種「inception-prompting」技術實現智能體之間的自主合作。與 AutoGen 不同的是,CAMEL 本身不支持工具使用(如代碼執行)。盡管 CAMEL 被提議作為多智能體對話的基礎設施,但它只支持靜態對話模式,而 AutoGen 還支持動態對話模式。」


圖片

表 1 為 AutoGen 與其他相關多智能體之間的差異總結,從四個指標著手判斷:一是基礎結構,即系統是否設計為構建 LLM 應用程序的通用基礎結構;二是對話模式,即系統支持的模式類型。在「靜態」模式下,無論輸入如何,智能體拓撲結構都保持不變。AutoGen 允許靈活的對話模式,包括可以根據不同應用程序需求定制的靜態和動態模式。三是可執行,即系統是否可以執行 LLM 生成的代碼;四是人工參與,系統是否(以及如何)允許人工參與執行過程。AutoGen 允許人工靈活地參與多智能體對話,并允許人工選擇跳過提供輸入。

圖片


AutoGen 論文中提及 CAMEL 的段落:「AutoGen 可以幫助開發能力超強的智能體,充分利用 LLM、工具和人類的優勢。創建這樣的智能體對于確保多智能體工作流能夠有效地排除故障并在任務中取得進展至關重要。例如,我們觀察到,另一個多智能體 LLM 系統 CAMEL 在大多數情況下無法有效解決問題,主要是因為它缺乏執行工具或代碼的能力。這一失敗表明,僅有簡單角色扮演的 LLM 和多智能體對話是不夠的,還必須有具備各種技能的高級能力智能體。我們認為,開展更系統的工作,制定針對特定應用的智能體指南,創建大型 OSS 知識庫,并創建能夠發現和提升自身技能的智能體是必要的。


在 AutoGen 提交給 ICLR 主會議審稿期間,CAMEL 一作李國豪在公共評論區指出了這一問題,并強調這是「值得注意的遺漏」。

圖片

在針對 AutoGen 的審稿意見中,ICLR 的審稿人和領域主席也指出了這種做法的不妥之處。

圖片

其中,領域主席寫道,「作者確實在附錄中討論了這一工作,但這種做法是不可取的,因為補充材料的審核級別與論文的審核級別不同。簡而言之,這似乎允許作者說他們引用和討論了論文,但實際上并沒有在 99% 的人可能閱讀的論文部分進行引用和討論。我認為這種做法令人擔憂。」

圖片

那 AutoGen 的作者為什么這么做呢?他們回復說:在他們將論文提交給 ICLR 2024 時,CAMEL 等論文尚未在同行評審會議 / 期刊上發表。根據 ICLR 2024 審稿人指南,他們沒有義務引用這篇論文或與之比較(CAMEL 于 2023 年 9 月被 NeurIPS 2023 錄用;ICLR 2024 審稿人指南規定,在 2023 年 5 月 28 日之后發表的論文不需要引用)。

圖片

同時,他們列出了論文中涉及 CAMEL 的部分:

圖片

鑒于 ICLR 規定在先,領域主席也不好多說什么。他寫道,「雖然我理解這項政策背后的基本原理,但在當前的出版氛圍下,它可能會導致奇怪的結果。由于 ICLR 的政策,我不會將其納入我的決定中,但這會降低我的信心?!?/span>

關于李國豪提及的相似性,AutoGen 作者也給出了反駁意見:

圖片

針對審稿人提出的問題,他們回復如下:   

圖片

最終,和 CAMEL 之間的相似性以及引用問題并未作為論文的主要問題被領域主席考慮在內。不過,AutoGen 論文最終還是因為其他原因被拒(所以后來作者轉投了 ICLR 2024  LLM Agent Workshop)。

根據李國豪的說法,兩篇論文的作者其實在線下見過面,但發生了一些不愉快:

圖片

李國豪希望能夠通過發帖引起學術界的重視。

圖片

對此,你怎么看呢?

責任編輯:張燕妮 來源: 機器之心
相關推薦

2011-12-29 10:26:00

IBM彭明盛羅睿蘭

2012-08-27 09:39:23

陌陌社交APP

2024-01-18 17:56:07

2012-01-05 10:26:26

JavaApache

2011-10-04 23:26:54

微軟蘋果iOS

2012-03-09 09:47:51

Apache CameJava

2022-08-14 15:46:52

神經網絡AI

2009-10-21 09:30:48

Windows 7蘋果抄襲

2022-05-26 05:37:00

人工智能機器學習AI

2013-05-23 09:25:06

2018-02-26 16:07:48

Android3DDepth

2021-08-12 10:42:36

Windows 功能系統

2012-03-12 15:14:17

iPad

2015-11-18 13:54:41

網易段子

2015-02-27 10:15:34

Wifi萬能鑰匙Wifi安全

2022-06-22 10:23:42

互聯網用戶IE瀏覽器退休

2013-04-23 16:24:21

Windows Blu開始按鈕

2019-01-10 15:06:19

微信數據報告騰訊

2012-01-11 10:48:05

微軟Windows Ser

2009-02-06 09:10:41

Windows 7UAC漏洞
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 一区二区精品 | 欧美一区二区三区在线观看视频 | 二区中文字幕 | 久久精品久久久 | 国内精品免费久久久久软件老师 | 亚洲精品一区国产精品 | 自拍 亚洲 欧美 老师 丝袜 | 日韩欧美国产精品 | 欧美一级三级在线观看 | 国产一区精品在线 | 日韩av啪啪网站大全免费观看 | 国精产品一区一区三区免费完 | 91porn在线| 一级片在线观看 | 一区二区精品视频 | 国产日产久久高清欧美一区 | 婷婷久久久久 | 精品国产一区二区三区av片 | 国产精品v| 亚洲一区二区三区桃乃木香奈 | 亚洲一区在线播放 | 亚洲免费在线视频 | 国产精品久久国产精品久久 | 精品自拍视频 | 成人一级毛片 | 亚洲精品国产成人 | 成人精品系列 | 日韩视频一区二区三区 | 一区欧美 | 亚洲精品久久久久中文字幕二区 | 精品一区久久 | 成人在线视频免费看 | 亚洲日韩视频 | 91精品国产乱码久久久久久久 | 亚洲精品久久久久久国产精华液 | 国产精品激情 | 超碰综合 | 日韩精品中文字幕一区二区三区 | 黄色成人免费在线观看 | 97高清国语自产拍 | 天天弄天天操 |