被罵了三年,谷歌Dropout專利還是生效了,卡脖子預警
本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。
谷歌的Dropout專利,6月25日生效了。
有效期15年。
所謂Dropout是一種搞深度學習、訓練神經網絡時,普遍會用到的方法,由Hinton于2012年提出,可以有效防止過擬合。
三年前,因為谷歌給Dropout申請了專利,就已經引發過一次業界嘩然。當時,reddit上有個熱帖,言辭激烈的把谷歌、還有當時未獲圖靈獎的Hinton等人統統給“問候”了一個遍。

歷史證明,罵街是沒有用的。如今,Dropout依然是AI領域的必備武器,而且——谷歌已經確定地拿到了專利授權。
先不要慌。
你看,網友@peng321就說:
別擔心,只要等到2034年,它就過期了。
當然,在Dropout專利過期之前,所有人,所有要用到Dropout的人、公司、機構,都可能要面臨一個被掐脖子的尷尬境地。
reddit網友@rantana總結了一下:
- 如果你是一家試圖融資的創業公司,在你的算法中使用谷歌的專利,會影響你的估值。
- 如果你跟谷歌有專利糾紛,起訴人家前要三思,分分鐘反訴你。
- 如果你是谷歌的專利律師,恭喜你成人生贏家。
Dropout是啥?
專利的名字是:解決神經網絡過擬合的系統與方法 (英文如下) 。

看看摘要,就知道Dropout的基本原理:
這是一個用來訓練神經網絡的系統。特征檢測器 (Feature Detectors) 上面,都連著一個開關,至少網絡的某些層是這樣。
在每一個training case里,開關都會隨機關閉一些特征檢測器,是根據一個預先配置的概率來決定的。
然后,每個訓練案例的權重,會被歸一化 (Normalized) ,以將神經網絡應用在測試集上。
至于為什么能防過擬合,Hinton爺爺和小伙伴們,在CNN成名作ImageNet Classification with Deep Convolutional里面,大致講到了這樣的意思:
每次關掉一半的特征檢測器,每次訓練的都是不一樣的網絡。然后取各種網絡的平均,用來預測。這樣可以提升模型的穩定性,或是泛化能力,防止過擬合。
專利文件上填的發明者,也是這篇論文的各位作者,只不過申請者是谷歌:

關于專利都包含了哪些內容,谷歌列舉了20條,細數了各種想到、想不到的訓練步驟:

算是Dropout的一份優秀使用說明了。
如果大家在打擊過擬合的過程中,產生了困惑,大可以進去查一查。
當然,這不是重點。
關鍵是,以后再用Dropout,會受到怎樣的限制啊?
開源的重大障礙
名叫mtanti的網友問:
就是說我們以后都不能用Dropout了么?
樓下 (NicolasGuacamole) 的回答很精彩:
誰用了,就拿無人機除掉誰。
戲謔是其中一種態度,把它用正常的句子講出來就是:
谷歌也不會真的去用這項專利的。
當然,不是所有人都這樣看。
其實,早在三年前,這項專利已經獲批,并且激起了嚴重的反彈。
△ Dropout專利申請授予信息
至于是預見到了怎樣的未來,才會生出這樣的情緒,網友 (AnonMLResearcher) 認真地分析過:
曾經有人說“不要怪玩家,要怪就怪制定游戲規則的人。”
就是說,我們不應該指責谷歌,應該指責專利制度。
既然允許這樣著名的抽象概念被注冊專利,谷歌也有他們的合法權利。
我只是害怕,這可能會對機器學習的學術研究帶來重要的損害。
在視覺領域,SIFT和SURF已經被注冊了專利。這樣,像OpenCV這樣的開源庫,就十分困擾了。
repo里面沒有包含“不免費 (Nonfree) ”模塊,所以用戶要從源代碼開始自己搭建,就很麻煩。
以后,開源機器學習庫還是會遇到同樣的事情。
卡脖子預警
而且Dropout這樣的基礎算法成谷歌專利,之所以備受關注,影響還不止于開源社區。
網友 (AnonMLResearcher) 說:
這樣的專利,對任何年輕的機器學習公司都會有影響,讓他們更難吸引到投資——現在谷歌對許多算法已經有知識產權了,(如果使用專利代碼) 隨時可能被起訴。

一度引起廣泛討論的“徐匡迪之問”,也再次被拿出來討論。
今年5月,上海院士沙龍活動中,中國工程院院士徐匡迪等多位院士尖銳一問:中國有多少數學家投入到人工智能的基礎算法研究中?
尷尬現狀是,中國AI的應用雖然當前如火如荼,但自主知識產權的底層框架和核心算法非常缺乏,更多還是依靠開源代碼和算法。
接受科技日報采訪的浙江大學應用數學研究所所長孔德興教授就呼吁:如果缺少核心算法,當碰到關鍵性問題時,還是會被人“卡脖子”。
孔教授說,開源代碼是可以拿過來使用,但專業性、針對性不夠,效果往往不能滿足具體任務的實際要求。孔教授認為,是否掌握核心代碼將決定未來的AI“智力大比拼”中是否擁有勝算。
而今年一而再的例子已經證明,核心算法靠燈塔,即便口碑如谷歌,可能也會有斷供的一天。
所以Dropout成谷歌專利,不只關于開源,不只停留在科研,還關乎更致命的自主核心算法和背后的“卡脖子”困境。