成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

嚴禁AI評審!CVPR 2025重申大模型審稿0容忍,一首拒稿小詩爆笑全場

人工智能 新聞
審稿人嚴重不足,審稿意見急劇下滑,CVPR官方坐不住了,不僅出臺了七條新規,還再三強調,禁止審稿人用大模型生成/翻譯評審結果。

CVPR的投稿量每年都在刷新紀錄,總以為今年是巔峰,但明年只會更多。

圖片

圖片

CVPR 2024收到11532次提交,增幅達到了26%;今年的投稿增速雖然有所放緩,達到13%,但也超過了13000次提交。

投稿量過大,最直接導致的一個問題就是「高質量審稿人不足」,很多人為了簡化審稿流程,可能會選擇用大模型進行審稿。

圖片

比如CVPR 2024大約有9000名審稿人,但投稿作者的數量卻超過了30000,為了平衡投稿與審稿,這屆CVPR提出了七條審稿新規,來限制不負責任的審稿結果。

目前,CVPR 2025的審稿即將開啟,今天也是區域主席提交推薦審稿人的最后期限,與此同時,官方推特再次發文強調了,絕對禁止使用大模型在「任何流程」中參與審稿!

圖片

圖片

搞笑的,CVPR直接附上了用LLM作了一篇拒稿的小詩的離譜案例。(手動狗頭)

圖片

不過話雖如此,但網友在評論區中表示,雖然想法是好的,但并沒有任何具體、可靠的方式來貫徹執行;即使審稿人用了大模型,也沒辦法證明這件事。

圖片

CVPR 2025審稿新規七板斧

圖片

為了應對投稿量的上漲,以及審稿質量的下降,CVPR 2025對會議規定做了七條修正,算是解決「大模型審稿」等問題的一個可行方案:

1、除非作者在CVPR 2025中擔任其他職務,否則所有作者都都有義務擔任審稿人,負責的審稿數量將根據作者資歷水平決定。

2、如果審稿人被區域主席標記為「高度不負責任」,那其提交的論文也可能會被直接拒絕,要根據具體情況而定。

3、每位作者最多提交25篇論文,其中25篇的限制來源于CVPR 2024中單個投稿人最多的中稿數量。不過網友普遍表示,25篇還是太多了。

圖片

4、在任何階段,都不允許使用大模型撰寫審稿意見。

5、在最終論文決策公布后,審稿人的姓名在OpenReview上也會對其他審稿人可見。

6、每位投稿人都需要填寫完整的OpenReview個人資料,以便更好地進行分配審稿人和利益沖突檢測,否則論文也會被直接拒絕。

7、CVPR 2025的審稿數據會共享給其他會議,對不負責的審稿人可以起到長久的限制作用。

其中第二條最具威懾性,不負責任的審稿意見包括,只有一兩句內容、使用大模型生成、與被審論文不相關,或者是遺漏了重要內容。

圖片

對于大模型,CVPR特意在審稿指南中列出要求:不能要求大模型撰寫審稿內容,只能根據自己對論文的判斷;不能向大模型共享論文或評審中的實質性內容,比如用大模型來翻譯評審意見;可以使用大模型進行背景調研或語法檢查,以確保審稿意見清晰。

不過具體執行時,這七條新規能否起到作用,還要等CVPR 2025論文錄用結果發布后,再看各家網友對審稿結果的反應如何。

大模型審稿,堵不如疏

早在2023年1月,ICML就發布了關于禁止使用大模型來撰寫論文的規定。

嚴禁任何形式的抄襲,以及審稿人、領域主席(AC)和高級領域主席(SAC)對特權信息的不道德使用,例如共享此信息,或將其用于評審過程以外的任何其他目的。

禁止包含從大模型(LLM)(如ChatGPT)生成的文本的論文,除非這些生成的文本作為論文實驗分析的一部分呈現。

所有可疑的不道德行為都將由道德委員會進行調查,被發現違反規則的個人可能會面臨制裁。

當時網友的普遍反應都是不理解,認為使用大模型進行潤色是很正常的,MIT教授Erik Brynjolfsson甚至評價為「一場必敗的仗」;LeCun當時還玩了一個文字游戲,「中小型模型」可以用嗎?

圖片

如今看來,ICML確實敗了,CVPR 2025新規中,允許使用大模型潤色,但仍然不允許編寫實質性審稿內容。

凡是合乎理性的東西都是現實的,凡是現實的東西都是合乎理性的。

既然用大模型審稿有他存在的現實意義,那么也一定有其合理性,科研大勢就是使用大模型參與到審稿、論文編寫過程中,已經有大量的相關研究來利用大模型輔助人類審稿,還提出相關評估基準等。

圖片

論文地址:https://arxiv.org/abs/2310.01783

比如斯坦福學者發現,GPT-4對于Nature、ICLR的論文給出的審稿意見,和人類審稿人已然有超過50%的相似性,未來讓大模型輔助論文評審,也并不是完全不靠譜。

圖片

再換個思路,難道人類審稿就一定靠譜了嗎?

圖片

圖片

圖片

既然無法一禁了之,更好的方法或許是引導審稿人合理利用大模型,比如官方提供大模型接口界面,標注出論文中的關鍵點,方便審稿人快速、直觀地理解論文內容;有了更方便的工具之后,尋求外部大模型工具進行優化的動力就會小很多。

另一方面,科研人員也可以對所有大模型參與審稿的過程進行標準化,評估不同模型在審稿過程中的可靠性。

圖片

靠強硬規定來禁止大模型并不具備可操作性,只能起到威懾作用,即便引入所謂的「大模型數字簽名」,甚至是用分類模型來判斷審稿意見是否由AI生成,只要提交者自己重新編輯一下審稿意見,是否使用大模型也就無從判斷了。

關于大模型審稿,你怎么看?或者說,你希望自己的論文被大模型評審嗎?

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-02-27 12:30:00

2024-09-18 10:25:00

計算機視覺AI

2025-02-28 10:05:00

AI生成

2024-10-17 13:09:14

2023-11-03 13:06:44

2025-03-13 09:16:25

2024-02-19 13:10:02

AI模型

2020-07-16 17:52:30

戴爾

2018-04-26 10:04:17

2025-04-30 16:48:07

2025-06-03 08:32:00

2025-03-17 09:20:00

視覺生成模型

2025-04-22 09:22:00

模型檢測AI

2018-04-24 08:54:32

編程語言簡歷敏捷性

2018-05-10 12:31:01

2019-07-02 14:49:46

代碼編程語言

2024-12-25 08:02:17

人工智能AI運維

2024-05-09 11:24:20

AI論文
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美日高清 | 国产乱码精品1区2区3区 | 美女久久久久久久久 | 欧美日高清视频 | 日韩中文字幕在线播放 | 一区二区三区在线电影 | 一区二区三区四区国产 | 一区二区三区免费观看 | 久久99久久98精品免观看软件 | 亚洲欧美一区二区三区在线 | 欧美国产精品一区二区三区 | 亚洲天堂成人在线视频 | 亚洲自拍偷拍av | 国产成人精品一区二三区在线观看 | 日韩国产欧美一区 | 国产精品视频久久久久久 | 国产成人精品网站 | 99久久久久国产精品免费 | 久久久91精品国产一区二区精品 | 天堂在线中文字幕 | 国产1区2区| 日韩精品中文字幕在线 | 91精品国产乱码久久久 | 日日草天天干 | 不卡的av在线 | 国产一区精品 | 亚洲精品一区中文字幕乱码 | 亚洲3p| 野狼在线社区2017入口 | 性欧美精品一区二区三区在线播放 | 可以看黄的视频 | 国产国产精品久久久久 | 欧美一级艳情片免费观看 | 亚洲国产精品99久久久久久久久 | 99re在线视频 | 国产视频欧美 | 欧美性一区二区三区 | 在线观看中文字幕视频 | 国产区一区二区三区 | 日韩一区二区福利视频 | 日日碰狠狠躁久久躁婷婷 |