人工智能全新突破:神經網絡可自主識別圖片中的對象
人腦非常奇妙。在幾十年研究之后,人類仍然無法復制出人腦的超快計算速度。目前,計算機科學家可以利用的***大工具是神經網絡。這樣的大型計算機網絡能通過訓練去解決復雜問題,而機制類似于人類的中樞神經系統,即利用不同層次的神經元解決問題的不同部分,最終合并為適當的答案。
目前的問題在于,這樣的神經網絡需要大量數據輸入和訓練,隨后才能學會如何解決問題。例如,ImageNet是個很好的訓練數據源,這一龐大的可視化信息數據庫中包含100萬張經過人工標注的照片。
這被稱作“監督學習”,而真正的人工智能意味著,神經網絡需要學會如何自動完成“無監督學習”。這正是芬蘭創業公司Curious AI希望實現的目標。
Curious AI***技術官安迪·拉斯姆斯(AntTI Rasmus)在赫爾辛基的Slush 2016科技行業大會上表示:“人腦會進行大量的無監督學習。我們不需要反復告訴嬰兒,勺子是什么。他們可以自動從環境中學習,并形成概念。”
“對人腦來說,根據某一對象形成概念很簡單。這已在心理學中得到了研究,即‘格式塔理論’。人腦會將具備類似形狀、顏色、運動狀態和模式的東西歸類在一起。我們采取的***步是讓深度學習系統能像人腦一樣,對對象進行歸類。”
將神經科學應用于人工神經網絡
在神經科學中,名為“速率編碼”的理論認為,大腦中神經元的激發速率越高,神經元就越活躍。神經元持續被激發。而80年代時,科學家發現,神經元會將自身組織在一起,代表不同的信息。
這一理論被稱作“臨時編碼”。理論認為,神經元的激發時機很重要,而準確的激發時機定義了,在數萬神經元中哪些神經元屬于同一群體。因此,一部分神經元可以同時激發,幫助大腦識別一系列對象中的某個對象,例如一堆辦公用品中的一塊紅布,而另一部分神經元會告知大腦,其他對象都屬于背景信息。
拉斯姆斯表示:“我們的計算機算法集成了臨時編碼機制。我們在神經網絡的每層中保存多個拷貝。整個神經網絡被復制了4次。這意味著系統可以學習得知,每個拷貝代表了某個特定對象,而將這些對象合并在一起,就可以與原始圖像進行匹配。”拉斯姆斯此前曾是英偉達的軟件工程師,目前正在芬蘭阿爾托大學從事深度學習的博士研究工作。
“通過將圖像分為不同的4組,神經網絡可以自行編碼圖像。這就是無監督學習,我們不用對系統進行任何標記。當我們向神經網絡展示圖片時,它會將圖片自主分解成為元素(例如圖片中的對象)。”
在神經網絡將圖片分解為單獨元素之后,歸類和識別對象就變得更容易,因為這些對象不會相互重疊,導致圖像模糊不清。
知覺分組可以給深度學習帶來變革
研究人員最初指導神經網絡在無監督的情況下分析圖片,組織對象,隨后向圖像加入標記信息(監督學習),從而觀察系統究竟學會了什么。他們發現,Curious AI的Tagger系統能實現75.1%的準確率。
作為對比,傳統神經網絡的準確率只有21%,比隨機猜測的準確率僅僅高出1%。
拉斯姆斯表示:“這是革命性的研究,這使得無監督學習獲得了進一步發展。通過讓機器獲得對象的概念,我們實現了更類似人腦的無監督學習。這可以幫助未來的研究,讓神經網絡進行更高層次的推理,學習對象與環境的相關性。”
“在當前系統中,計算機運行在基于統計的世界觀中。如果讓計算機進入人類生活的世界,那么非常重要的一點是讓機器以類似人類的方式去理解世界。人們通常很難理解計算機視覺的效果很差,因為人眼視覺對我們來說很自然。”
該公司的相應論文《Tagger:深度無監督知覺分組》將于12月7日在巴塞羅那的“神經信息處理系統2016”深度學習大會上發表。