無貢獻無創新無思路,ML領域準博士求助:論文到底要怎么創新?
本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。
機器學習領域水寫論文日常:
△圖源推特:AI Memes for Artificially Intelligent Teens
明明想得很美:要提出一個更好的新架構、新損失函數、新優化器或激活函數……
而實際正在做的呢?
在一個數據集上應用現有的東西(如架構,優化器,損失功能),嘗試不同的組合以找到該數據集上的最優解。
這就是Reddit上的一位準博士現階段的煩惱:
無貢獻無創新無思路,ML領域準博士求助:論文到底要怎么創新?
他并不滿意目前的工作,也不知道自己都做了哪些貢獻。
所以帖子標題非常直接:
如何在機器學習領域寫論文時保證創新性?
關注現實問題和細分領域
而對于這一問題,下方討論的網友們基本分為了兩類。
第一類認為,不要刻意去追求“創新”,而是先嘗試從解決現實問題出發:
一個新想法的出現,通常是為了試圖解釋一些以前沒有解決的問題。
或是這一問題已有方法(但你找到了更好的解決方案)。
現實中確實有很多這樣的例子。
比如強化學習領域的很多論文都是集中在游戲上的。
造成這種現象的原因之一,就是大家在一開始都是用較低的成本讓模擬器快速運行的。
但慢慢地,這種傳統方法就讓游戲暴露出了不少問題:
比如,只有在執行了一長串的正確行動(actions)后,你的(強化學習)模型才能得到獎勵信號(reward signals)。
像這種實際應用中的困難,很容易就能引申到“要如何解決”或“怎么讓現有方法變得更好”上。
那創新點不就來了?
而第二類網友則直接從問題根源入手:
別再在ML大領域里浪了,趕緊選個利基領域 (niche area)上吧。
什么是利基領域?
這是指一個大領域下尚未被其他人所占領的某個專業的小領域,也叫細分領域。
這一類網友覺得,你要在機器學習領域內創新,那就意味著要跟成千上萬的科研人競爭,這談何容易?
所以還不如去一些“過氣”的分支領域去試試。
比如30年前在AI領域中流行過的歸納邏輯程序設計(ILP):
當然,這種方法更適用于當你的目標是“獲得博士學位就算成功”的時候。
畢竟這樣做很可能導致你的引用數常年在個位數打轉……
最后就是Just Try it的保留節目了:
就算最后失敗了,你也會對相關問題有更深的理解,或產生新的思考。
同時,這也能側面印證你選擇的課題是不是真的有價值:
畢竟對于牛逼的課題,即使失敗也是成功的墊腳石。
但如果你完全無法從這次失敗中收獲新的東西的話——
那還是趕緊跑路另擇idea吧。
永恒的難題:idea
其實今天開貼的這位題主所說的“保證論文創新性”,說到底還是一個idea的問題。
而對于廣大科研人來說,這是個永恒的話題。
比如說19年時,就有這種“發現自己的idea已經被人發表了該怎么辦?”的討論帖了:
(只聽標題都是聞者傷心聽者落淚)
大家在下面集思廣益了半天,從如何避免撞車,到撞車之后如何擴展強化,再到個人能力培養和學術環境,最后表示:
湊合一下,克服一下,適應一下。
而在去年,來自清華的高天宇同學也在直播中分享了他的idea來源:
這位本科期間就發表過兩篇AAAI和兩篇EMNLP的大神表示:
idea的形式多種多樣,有原創的突破性工作,就像發明襯衫;也有排列組合、遷移、漸進的補充性工作,就像給襯衫裝上紐扣和前衣口袋;而灌水就像是在衣服背后縫了個口袋。
今年,甚至有位英國教授專門寫了篇論文來指導大家如何寫論文:
作者主要從建模前如何準備、如何建出可靠的模型、如何穩健地評估模型,如何公平地比較模型以及如何報告結果五個方面,全面闡述了如何避免機器學習研究中的陷阱。
那么最后,你覺得還有什么保證論文創新性(或尋找idea)的方法呢?
清華特獎高天宇:
https://www.qbitai.com/2020/03/12309.html
如何寫一篇不水的機器學習論文:
https://www.qbitai.com/2021/08/27616.html
發現自己的idea已經被人發表了,該怎么辦?
https://www.qbitai.com/2019/06/3337.html