研究了個寂寞?Reddit熱議:AI教父Yann LeCun提出的『能量模型』到底是個啥?
“能量自監督學習到底是什么鬼?”不少Reddit網友評論說。
剛剛,深度學習教父Yann LeCu登上了Reddit熱搜。一位不知名的開發者發表了一篇題為“Yann LeCun提出基于能量的自監督學習到底是什么”的帖子,引發眾多網友討論。
討論的焦點之一是,基于能量的自監督學習模型能做什么?有什么優勢或意義?
這位開發者剛剛看完LeCun最新的主題演講,他說,Yann LeCun似乎是在建議訓練一個有條件的潛在變量模型,它可以根據輸入和潛在變量預測輸出(類似于pix2pix GAN或VAE);同時,它也可以處理圖像、視頻或者音頻等不同類型。
但有關優化生成模型的方法有很多,比如OpenAI通過iGPT預訓練預測缺失像素,采用“對比預測編碼法”,通過對比損失來進行丟失信息預測。這些方法在實際應用中均取得不錯的成果。
相比之下,基于能量的自監督學習好像并沒有特別之處,也沒有相關的成功應用案例。
Reddit上,超過95%的網友對這一觀點表示了贊同。
另外,還有一位網友透露,最近3-4年很多專家都對它很著迷,他們認為基于能量的模型是深度學習的『未來』。
那么,代表ML未來的『能量模型』到底是什么?
AI的未來:『能量』SSL模型
Yann LeCun,是2018年圖靈獎得主之一,與Geoffrey Hinton 和 Yoshua Bengio二人被合稱為深度學習三巨頭。同時,他自己也被稱為“CNN之父”。
LeCun在在業界和學術界頗具影響力。目前,他在Facebook公司擔任人工智能研究院院長一職,同時也在紐約大學、Courant 數學科學研究所、神經科學中心和電氣與計算機工程系等擔任要職。
2019年11月,LeCun代表Facebook參加了《Using Physical Insights for Machine Learning》主題研討會,并發表了名為《基于能量的自監督學習(Energy-Based Self-Supervised Learning)》的主題演講。
在這篇演講中,LeCun詳細介紹了基于能量的學習方法在解決現有挑戰方面的可能性。
近幾年,深度學習在計算機感知、自然語言理解和控制方面取得了重大進展。但這些成功在很大程度上都依賴于監督學習或無模型強化學習。其中,監督學習是從標記的訓練數據來推斷一個功能的機器學習任務。強化學習分為有模型和無模型兩種策略,前者區別與后者的特點是,有模型的方法主要學習前向狀態轉移模型p(st+1|st,at),而無模型方法則不是。
從現有研究來看,無論是監督學習,還是無模型強化學習都存在明顯的局限性。前者需要人類提供大量數據標簽,后者需要機器學習動作回報最大化。
也就是說,監督學習只適用于特定任務,即使是學習簡單的任務;強化學習也需要與環境進行大量的交互。例如,它在游戲和仿真工作中十分有效,但在現實世界很難奏效。
但如果存在一款模型能夠像人類或動物那樣,只需要少量觀察和互動就能學習大量與任務無關的知識,那么這些現實困境就可以被很好的解決。而這款模型必須依靠自監督學習(Self-Supervised Learning,簡稱SSL)方法。
LeCun認為,SSL是深度學習的『未來』,基于能量的SSL可以在回避概率的同時處理不確定性。以下是基于能量的SSL模型:
標量值能量函數F(x,y)可以被測量,包括:
-
測量x和y之間的兼容性。
-
低能量:y是x的最佳預測
-
高能量:y是x的最差預測
同時,它也有無條件的模型版本。
在訓練方面,首先將能量函數參數化,在獲取訓練數據,最后計算出新Shape。這個過程通常有兩種方法,一是對比法(Contrastive Methods),二是建構法(Architectural Methods)。
其中對比法涉及三種策略:
C1:數據點能量下推,其它位置上推:最大似然(Max likelihood)。
C2:數據點能量下推,選擇位置上推:最大似然和MC/MMC/HMC,對比散度,度量學習,噪聲對比估計,比率匹配,噪聲對比估計,最小概率流,對抗生成器GAN
C3:訓練一個函數,將數據流形上的點映射到數據流形上的點:去噪自動編碼器,屏蔽自動編碼器(如BERT)
建構法涉及三種策略:
A1:建立機器使低能量物質的體積有界:PCA,K-均值,高斯混合模型,平方ICA。
A2:使用正則化項來度量具有低能量的空間體積:稀疏編碼、稀疏自動編碼器、LISTA、變分自動編碼器
A3:F(x,y)=C(y,G(x,y)),使G(x,y)相對于y盡可能“恒定”:收縮自動編碼器,飽和自動編碼器。
A4:最小化梯度,最大化數據點周圍的曲率:分數匹配
在此基礎上,LeCun還演示了關于視頻預測的應用實例。他表示,無監督學習會成為未來的主流,能解決我們的學習系統難以處理的眾多問題,研究無監督和預測性前向模型(predictive forward model)的建立,也會是接下來幾年的挑戰。
(文末獲取LeCun完整PPT內容)
網友評論:『能量』的意義在哪??
實際上,LeCun的能量SSL理論還處在“ppt階段”。
目前還未有大量的成功應用案例,而他在PPT中也僅演示了自動駕駛預測視頻的結果。一位網友表示,他曾利用能量SSL模型做過一項測試。
如上文所述,在能量函數F(x,y)最小化上,LeCun提供了兩種訓練方法:對比法和和建構法。但在這個過程中,他認為有多個不合理之處。比如:自動編碼器的潛在變量在哪里?按構造,有沒有事先分配樣本的潛在權利?
如果訓練的每一個SSL模型都可以解釋為基于潛在變量的能量模型,這可能是不正確的。如果拋開潛在變量,認為每個模型都是基于能量的模型,可以勉強接受,但這還有什么意義呢?
它僅僅能夠作為一種解釋性理論,似乎并不具備應用的價值。
還有一位網友表示,LeCun所作的可能是一項“基礎性研究”,就像Hinton研究膠囊網絡(CapsulesNet)一樣。基礎性研究成功的可能性很低,通常是其他人在此研究之上開創應用。
另一位網友表示,Yann基于能量的學習方法確實啟發了基于深層能量的強化學習(RL)研究,軟演員-評論家(Soft Actor-Critic,SAC)模型已經在多個RL基準上實現了SOTA。
那么,你同意這位網友的看法嗎?你認為『能量模型』的價值在哪里?