2023放榜!接收率15%:中稿全憑運氣?rebuttal沒用?審稿人只盯負面評價?
又到頂會放榜時,幾家歡喜幾家愁。
本次IJCAI 2023共收到4566份提交全文,接收率大約15%
問題鏈接:?https://www.zhihu.com/question/578082970?
從知乎上反饋的結果來看,整體審稿質量依然不盡如人意(也可能是被拒稿的怨念...),甚至有的審稿人根本沒看rebuttal的內容就給拒了。
也存在都是分數相同,但結局不同的論文。
也有網友貼出meta review的拒絕理由,全是大缺點。
不過拒稿并不是終點,更重要的是繼續出發。
網友Lower_Evening_4056認為,即便是里程碑式的論文也會被多次拒稿,也有一些論文即便不夠出色,也能被錄用。
當你繼續前行,再回過頭來看那些合理的審稿意見時,你會發現自己的工作還能再上一個層次。
審稿系統確實存在缺陷,更重要的是不要把reject看作是對你個人或作品價值的評估結果。如果你是一個學生,并且你的導師根據審稿結果而不是工作質量來評價你的話,那你可能就要重新考慮和導師的合作關系了。
NeurIPS會議此前開展過一致性實驗,對于平均分在5到6.5之間的論文,錄用結果基本就是隨機的,取決于你碰到的審稿人。
比如說有個人的論文結果是9665,如果他沒碰到給他9分的審稿人,那結果必然是reject,只不過他剛好碰到了伯樂,并且扭轉了審稿結果。
最后,恭喜那些論文錄用的科研人,助力推動人工智能研究的發展!
下面是一些在社交媒體上分享已錄用的論文。
IJCAI 2023接收論文
端到端抗噪語音識別中多任務學習的梯度修正
在下游語音自動識別系統(ASR)中,語音增強學習策略(SE)被證明能夠有效地減少噪聲語音信號產生的噪聲,該系統采用多任務學習策略對這兩個任務進行聯合優化。
然而,通過 SE 目標學習的增強語音并不總是產生良好的 ASR 結果。
從優化的角度來看,自適應任務和自適應反應任務的梯度之間有時會存在干擾,這會阻礙多任務學習,最終導致自適應反應性能不理想。
論文鏈接:?https://arxiv.org/pdf/2302.11362.pdf?
這篇論文提出了一種簡單而有效的梯度補償(GR)方法來解決噪聲魯棒語音識別中任務梯度之間的干擾問題。
具體來說,首先將 SE 任務的梯度投影到一個與 ASR 梯度呈銳角的動態曲面上,以消除它們之間的沖突,協助 ASR 優化。
此外,自適應地調整兩個梯度的大小,以防止主導 ASR 任務被 SE 梯度誤導。
實驗結果表明,該方法較好地解決了梯度干擾問題,在多任務學習基線上,在 RATS 和 CHiME-4數據集上分別實現了9.3% 和11.1% 的相對詞錯誤率(WER)降低。
約束 Tsetlin 機器子句大小構建簡明邏輯模式
Tsetlin 機器(TM)是一種基于邏輯的機器學習方法,具有透明和硬件友好的關鍵優勢。
雖然 TM 在越來越多的應用程序中匹配或超越了深度學習的準確性,但是大子句池往往產生具有許多文字(長子句)的子句,使得它們變得不那么容易理解。
此外,較長的子句增加了硬件中子句邏輯的切換活動,具有更高的功耗。
論文鏈接:?https://arxiv.org/abs/2301.08190?
這篇論文介紹了一種新的 TM 學習方法,即子句大小受限的子句學習方法(CSC-TM) ,可以對子句大小設置軟約束。
一旦子句包含比約束允許的更多的字面值(literals),就開始排除字面值,因此只會短暫出現較大的子句。
為了評價 CSC-TM,研究人員對表格數據、自然語言文本、圖像和棋盤游戲進行了分類、聚類和回歸實驗。
結果表明,CSC-TM 保持準確性與多達80倍的文字減少,實際上,TREC、 IMDb 和 BBC Sports 的子句越短,準確性就越高,在準確性達到峰值之后,當子句大小接近單個文字時,就會緩慢地下降。
文章最后分析了 CSC-TM 的功耗,得到了新的收斂性質。
#DNN-Verification問題:計算深度神經網絡的不安全輸入
深度神經網絡越來越多地用于需要高安全級別的關鍵任務,比如說自動駕駛,雖然可以采用最先進的驗證器來檢查DNN是否是不安全的:
給定一些屬性(即,是否存在至少一個不安全的輸入配置)后,模型的yes/no輸出對于其它目的(例如shielding、模型選擇或訓練改進)而言信息量不足。
論文鏈接:?https://arxiv.org/abs/2301.07068?
這篇論文介紹了#DNN-Verification問題,該問題涉及計算導致違反特定安全屬性的DNN輸入配置的數量,研究人員分析了這個問題的復雜性,并提出了一種新的方法,返回確切的違規計數。
由于問題是P-完備性的,文中提出了一個隨機的近似方法,提供了一個可證明的概率界的正確計數,同時顯著降低計算要求。
文中還提出了一組安全關鍵的基準,證明該近似方法的有效性和評估的約束的緊密性的實驗結果。