單個神經元通過預測未來活動來學習,有助于解釋大腦是如何工作的
幾個世紀以來,人類一直在試圖了解大腦是如何工作的,以及它是如何獲取信息的。雖然神經科學家現在已經很好地了解了大腦的不同部分是如何工作的以及它們的功能是什么,但仍有許多問題沒有得到解答。因此,仍然缺乏統一的神經科學理論。
近年來,計算機科學家一直在嘗試創建出能夠人工重建人腦功能和過程的計算工具。
加拿大萊斯布里奇大學(University of Lethbridge)的研究人員最近進行了一項研究,調查單個神經元如何學習和預測未來。表明單個神經元預測其未來活動的能力可以提供一種新的學習機制。
該研究結果以「Neurons learn by predicting future activity」為題,于 2 月 25 日發表在《Nature Machine Intelligence》上。
「神經科學現在所處的階段和生物學在達爾文之前所處的階段一樣,」該研究的研究人員之一 Artur Luczak說。「它有無數詳細的觀察結果,但沒有一個理論可以解釋它們之間的聯系。因此,神經科學的一大任務是找到統一的原則來解釋大腦是如何工作的。我們的工作旨在為這一探索做出貢獻。」
更好地理解大腦使用的學習算法可能是發展統一的大腦功能理論的核心。研究大腦學習機制的主要方法有兩種:(1)實驗性的,神經元活動的持續變化是由特定干預引起的;(2)計算性的,開發算法以實現特定的計算目標,同時仍然滿足選定的目標生物限制。
在這篇文章中,研究人員探索了一個額外的選項(3)理論推導,其中學習規則來自基本的細胞原理,即來自最大化細胞的代謝能量。
有多種證據表明大腦是作為一個預測系統運作的。然而,關于如何在大腦中實現精確的預測編碼仍然存在爭議。大多數提出的模型假設一個預測電路,但研究人員提出了一個替代方案,其中神經元中有一個內部預測模型。建議使用預測學習規則的單個神經元可以提供一個基本單元,從中可以構建各種預測性大腦。
有趣的是,研究人員提出的預測學習規則也可以通過修改時間差異學習算法來獲得,使其在生物學上更合理。時間差異學習是關于如何在大腦中實現類似反向傳播的算法的最有希望的想法之一。它基于使用神經元活動的差異來近似自上而下的誤差信號。這種算法的一個典型例子是對比赫布(Hebbian)學習,它被證明在某些假設下等同于反向傳播。
圖示:算法的基礎。(來源:論文)
預測學習規則和對比赫比學習對比 Hebbian 學習算法要求網絡在兩個獨立的學習階段收斂到穩態平衡,因此必須呈現兩次完全相同的刺激。然而,在實際大腦中不太可能出現這種情況。在這里,研究人員建議通過將兩個活動階段合二為一來解決這個問題,這是受到皮層感覺處理的啟發。
這里的新見解是,最初的自下而上活動足以讓神經元預測自由相活動的穩態部分,然后可以將預測的自由相和鉗制相(clamped phase)之間的不匹配用作教學信號。
為了驗證神經元能否正確預測未來的自由相活動,研究人員仔細研究了樣本神經元。研究表明預測學習規則運作良好,每個神經元準確地預測了其未來的活動。
圖示:預期活動的神經元預測。(來源:論文)
此外,還在多個其他網絡架構中測試了預測學習規則,這些架構旨在反映生物神經元網絡的其他方面。研究表明所提預測學習規則在各種生物驅動的網絡架構中表現良好。
圖示:在多層卷積神經網絡中實現預測學習規則。(來源:論文)
清醒動物的預測學習規則驗證為了測試真正的神經元是否也可以預測它們未來的活動,研究人員分析了來自清醒大鼠聽覺皮層的神經元記錄。作為刺激,呈現了六個音調,每個音調長 1 秒,并穿插 1 秒的靜默,連續重復超過 20 分鐘。對于六種音調中的每一種,分別計算了平均起始和偏移響應,為每個神經元提供了 12 種不同的活動曲線。對于每個刺激,15-25 ms 時間窗口中的活動用于預測 30-40 ms 窗口內的平均未來活動。
圖示:預測皮層神經元的未來活動。(來源:論文)
研究表明神經元具有可預測的動態,并且從最初的神經元反應,可以估計它們未來的活動。然而,通過預測皮質活動的長期變化提供了支持學習規則的更有力的證據。重要的是,根據所提模型,可以推斷出哪些單個神經元會增加,哪些神經元會降低其放電率。
圖示:模型和皮質神經元中神經元活動的長期變化。(來源:論文)
該研究可能對神經科學和機器學習領域產生許多有趣的影響。總體而言,他們的研究結果表明,支持單個神經元功能的預測機制可能在學習中發揮關鍵作用。
「在未來,這個想法還可能有助于創建更強大的人工神經網絡來解決具有挑戰性的現實生活問題,」Luczak 說。「我相信我們公布的預測學習規則是朝著找到統一的大腦理論邁出的重要一步。然而,實現這一目標還需要更多的步驟,我們很高興能繼續這一旅程。」
論文鏈接:https://www.nature.com/articles/s42256-021-00430-y