中科院DeepMind聯(lián)手,用深度學習揭示大腦如何識別人臉
本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。
DeepMind和中科院神經(jīng)科學研究所聯(lián)手了。
他們用無監(jiān)督深度學習揭示出大腦識別人臉的機制。
具體來說,大腦會把面部特征分解成一些語義特征,如年齡、性別或是否在微笑,而且是單個神經(jīng)元對應某個具體特征。
此外,他們構(gòu)建的模型利用少量神經(jīng)元的信號就能還原出整個面部圖像,相關論文發(fā)表在最新一期Nature Communications上。

論文共同一作為DeepMind研究員Irina Higgins和中科院神經(jīng)科學研究所研究員常樂。
其他參與者還包括DeepMind創(chuàng)始人哈撒比斯、加州理工神經(jīng)科學研究院主任曹穎等。
他們的實驗結(jié)果提出可以在單個神經(jīng)元的尺度上去理解大腦視覺。
這一結(jié)果可以說打破了以往的認知,即認為單個神經(jīng)元在很大程度上是不可解釋的,有意義的信息存在于大量神經(jīng)元的互動組合中。
相關領域的學者也表示會好好研究這篇文章,因為如果在看到這篇之前問他“無監(jiān)督深度學習能解釋大腦的什么機制嗎?”,他會毫不猶豫地說“沒戲”。

人工神經(jīng)元與獼猴神經(jīng)元有強對應
靈長類大腦有著驚人的處理視覺信息的能力,幾毫秒之內(nèi)就能對看到的復雜場景做出識別反應。
不過這種能力的具體運作機制一直沒有研究透徹。
中科院常樂和加州理工曹穎之前都對獼猴的視覺機制做過研究,找出負責獼猴大腦負責識別面孔的是下顳葉皮層 (inferotemporal cortex)中的一部分。
這次與DeepMind的合作中,他們選用自監(jiān)督的β-VAE(β變分自動編碼器)來模擬大腦中負責識別面孔的模塊。

在對比β-VAE模型的行為與獼猴的神經(jīng)活動數(shù)據(jù)的過程中,研究人員發(fā)現(xiàn)真實神經(jīng)元和人造神經(jīng)元之間存在強烈的一一映射關系。

這下可好,雖然大腦的機制不易研究,VAE的原理可是很明白。
編碼器把輸入數(shù)據(jù)在隱空間中編碼成各種特征,如物體的大小、顏色、位置,再由解碼器進行重建。
這種能力被稱為“解耦”或“解糾纏”,而β-VAE是VAE之中解耦能力較強的一種變體。
對于面部識別來說也是如此。
從年齡、性別到更具體的眼間距、眉毛粗細都會被分解成一個個特征。

β-VAE與獼猴神經(jīng)元間的強對應關系,意味著生物大腦很可能也是按這種方式去感知人臉。
為了驗證這一點,研究人員用獼猴神經(jīng)元的測量數(shù)據(jù)去訓練β-VAE,成功地進行了人臉的重建。

最后,研究團隊希望來自機器學習的最新見解可以反饋給神經(jīng)科學,并推廣到識別人臉之外的任務,特別是抽象推理或通用任務學習。
作者介紹
本文的共同一作、通訊作者Irina Higgins是DeepMind研究員,也是β-VAE模型論文的第一作者。
共同一作常樂是中國科學院神經(jīng)科學研究所的研究員,研究領域是結(jié)合功能核磁共振、電生理記錄和數(shù)學建模等手段來研究不同種類的物體如何在獼猴的下顳葉皮層進行表征。
常樂曾在加州理工任博士后期間與曹穎合作。
曹穎從2017年起擔任加州理工陳天橋雒芊芊腦科學研究院主任,2018年獲得麥克阿瑟天才獎,2020年當選美國科學院院士。
論文地址
https://www.nature.com/articles/s41467-021-26751-5