明斯基：差點(diǎn)將AI扼殺在搖籃里的人工智能之父

2016-01-28 10:53:15

當(dāng)你使用語音助手查詢天氣、進(jìn)行語音輸入時(shí)，用搜索引擎去搜索某張圖片時(shí)，和朋友聊天使用實(shí)時(shí)翻譯服務(wù)時(shí)，你可能不會(huì)注意到，這些工具背后的一個(gè)共同點(diǎn)：深度學(xué)習(xí)技術(shù)。過去幾年，深度學(xué)習(xí)，以及作為其基礎(chǔ)的人工神經(jīng)網(wǎng)絡(luò)正在快速發(fā)展，國內(nèi)的阿里巴巴、百度、科大訊飛，國外的谷歌、微軟、IBM等公司都試圖在這一領(lǐng)域搶占先機(jī)。

馬文·明斯基

　　1月24日，在波士頓去世的馬文·明斯基(Marvin Minsky)的身后，有一長排讓人肅然起敬的稱號(hào)：人工智能之父、世界上首個(gè)人工智能實(shí)驗(yàn)室——麻省理工學(xué)院人工智能實(shí)驗(yàn)室的聯(lián)合創(chuàng)始人、計(jì)算機(jī)領(lǐng)域頂級(jí)獎(jiǎng)項(xiàng)圖靈獎(jiǎng)的獲得者、虛擬現(xiàn)實(shí)先驅(qū)等等等等。但明斯基最重要的遺產(chǎn)，是神經(jīng)網(wǎng)絡(luò)技術(shù)。沒有明斯基，今天大部分的科技應(yīng)用，或許和你根本無緣。

　　舉例來說，當(dāng)你使用語音助手查詢天氣、進(jìn)行語音輸入時(shí)，用搜索引擎去搜索某張圖片時(shí)，和朋友聊天使用實(shí)時(shí)翻譯服務(wù)時(shí)，你可能不會(huì)注意到，這些工具背后的一個(gè)共同點(diǎn)：深度學(xué)習(xí)技術(shù)。過去幾年，深度學(xué)習(xí)，以及作為其基礎(chǔ)的人工神經(jīng)網(wǎng)絡(luò)正在快速發(fā)展，國內(nèi)的阿里巴巴、百度、科大訊飛，國外的谷歌、微軟、IBM等公司都試圖在這一領(lǐng)域搶占先機(jī)。

　　《紐約時(shí)報(bào)》在訃告中，引述明斯基的同事、計(jì)算機(jī)科學(xué)家艾倫·凱(Alan Kay)的評(píng)價(jià)：“馬文在計(jì)算領(lǐng)域中具有罕見的卓識(shí)，他把計(jì)算機(jī)從花瓶般附屬機(jī)器的定位中解放出來，并意識(shí)到計(jì)算機(jī)的使命，是成為有史以來，人類能力最強(qiáng)大的放大器。”明斯基的遠(yuǎn)見如今已經(jīng)成為現(xiàn)實(shí)，但是在人工智能的搖籃期，他卻差點(diǎn)親手扼殺了我們今天享受到的一切。

　　深度學(xué)習(xí)技術(shù)的早期工作可以追溯至20世紀(jì)40、50年代，而明斯基正是這一領(lǐng)域的先行者。在哈佛大學(xué)讀本科期間，他曾開發(fā)了早期的電子學(xué)習(xí)網(wǎng)絡(luò)。在普林斯頓大學(xué)念研究生時(shí)，他又建造了第一臺(tái)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)機(jī)SNARC。1956年，明斯基與“人工智能”的提出者約翰·麥卡錫(John Mcarthy)以及信息論之父克勞德·香農(nóng)(Claude Shannon)等人一同發(fā)起了“達(dá)特茅斯會(huì)議”，促成了人工智能革命的到來。

　　然而1969年，明斯基與西蒙·派珀特(Simon Papert)合著的著作《感知機(jī)》卻被業(yè)內(nèi)普遍認(rèn)為極大地阻礙了神經(jīng)網(wǎng)絡(luò)的發(fā)展。明斯基在這本書中著重闡述了“感知機(jī)”存在的限制。他指出，神經(jīng)網(wǎng)絡(luò)被認(rèn)為充滿潛力，但實(shí)際上無法實(shí)現(xiàn)人們期望的功能。

馬文·明斯基(左)與西蒙·派珀特(右)，二人合著的《感知機(jī)》被業(yè)內(nèi)普遍認(rèn)為極大地阻礙了神經(jīng)網(wǎng)絡(luò)的發(fā)展。

　　在他看來，處理神經(jīng)網(wǎng)絡(luò)的計(jì)算機(jī)存在兩點(diǎn)關(guān)鍵問題。首先，單層神經(jīng)網(wǎng)絡(luò)無法處理“異或”電路；其次，當(dāng)時(shí)的計(jì)算機(jī)缺乏足夠的計(jì)算能力，滿足大型神經(jīng)網(wǎng)絡(luò)長時(shí)間運(yùn)行的需求。

　　由于被明斯基這樣的權(quán)威人士看衰，神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)技術(shù)的研究迅速陷入了低谷，70年代則成為了“人工智能的寒冬”。2014年加入谷歌的人工智能專家杰弗里·辛頓(Geoffrey Hinton)當(dāng)時(shí)正在讀研究生，他也感受到了這樣的“惡意”。當(dāng)時(shí)，當(dāng)他告訴周圍人自己正在研究人工神經(jīng)網(wǎng)絡(luò)時(shí)，人們總會(huì)這樣回應(yīng)：“難道你不明白么？這些東西沒用。”

　　相關(guān)研究直到1978年才開始逐漸復(fù)蘇，而其中的關(guān)鍵人物則是辛頓和哈佛大學(xué)神經(jīng)生物學(xué)博士特里·謝伊諾斯基(Terry Sejnowski)。據(jù)《紐約時(shí)報(bào)》記者約翰·馬爾科夫(John Markoff)在《與機(jī)器人共舞》一書中介紹，1982年，辛頓舉辦了一場夏季研討會(huì)，主題是聯(lián)想記憶的并行模型，而與會(huì)的謝伊諾斯基當(dāng)時(shí)正在探索如何通過新方式來為大腦建模。他們的理念一拍即合。隨后幾年，從并行分布處理方法起步，他們創(chuàng)造了新的多層網(wǎng)絡(luò)“玻爾茲曼網(wǎng)絡(luò)”。這項(xiàng)研究也證明，《感知機(jī)》一書中所做的預(yù)言，即感知機(jī)無法被推廣至多層網(wǎng)絡(luò)，是完全錯(cuò)誤的。

2014年加入谷歌的人工智能專家杰弗里·辛頓。上世紀(jì)80年代，他和哈佛大學(xué)神經(jīng)生物學(xué)博士特里·謝伊諾斯基一同證明了明斯基的預(yù)言是錯(cuò)誤的。

　　辛頓和謝伊諾斯基隨后嘗試通過語言問題來展示新技術(shù)的力量。第一步，他們讓神經(jīng)網(wǎng)絡(luò)去學(xué)習(xí)一本兒童讀物。在啟動(dòng)的不到1小時(shí)內(nèi)，神經(jīng)網(wǎng)絡(luò)就開始工作。最初，它能正確說出兩個(gè)單詞，而之后詞匯量開始越來越豐富，并開始自我完善。隨后，他們向神經(jīng)網(wǎng)絡(luò)提供了更復(fù)雜的學(xué)習(xí)材料，例如一本有兩萬多個(gè)單詞的詞典。在經(jīng)過不斷學(xué)習(xí)后，神經(jīng)網(wǎng)絡(luò)甚至能朗讀從未見過的新詞。

　　他們將這一程序命名為Nettalk。這一神經(jīng)網(wǎng)絡(luò)集成了300個(gè)被稱作“神經(jīng)元”的模擬電路，并分為三層，包括用于捕捉單詞的輸入層，用于表達(dá)語音的輸出層，以及連接兩者的“隱藏層”。Nettalk的大獲成功重新點(diǎn)燃了研究人員對(duì)神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的熱情，并成為了隨后所有相關(guān)研究的基礎(chǔ)。

　　實(shí)際上，在進(jìn)入80年代后，《感知機(jī)》一書提到的兩大問題都已得到解決。一方面，摩爾定律的應(yīng)驗(yàn)使計(jì)算機(jī)處理能力飛速提升，計(jì)算能力不再成為制約神經(jīng)網(wǎng)絡(luò)的因素。另一方面，反向傳播算法的提出解決了關(guān)于“異或”電路實(shí)現(xiàn)的難題。隨后的近30年中，隨著軟件算法和硬件性能不斷優(yōu)化，深度學(xué)習(xí)技術(shù)終于可以大展拳腳。近年來，移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展、數(shù)據(jù)量的激增則給神經(jīng)網(wǎng)絡(luò)提供了充足的學(xué)習(xí)材料。

　　然而，明斯基仍不看好神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)技術(shù)。2007年，在新書《情感機(jī)器》出版的不久后，《Discover》雜志的蘇珊·克魯格林斯基(Susan Kruglinski)對(duì)明斯基進(jìn)行了采訪。后者再次重申了自己的觀點(diǎn)：

2007年，明斯基出版的著作《情感機(jī)器》。當(dāng)時(shí)他仍然不看好神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)技術(shù)。

　　“人工智能領(lǐng)域的每個(gè)人都在追求某種邏輯推理系統(tǒng)、遺傳計(jì)算系統(tǒng)、統(tǒng)計(jì)推理系統(tǒng)或神經(jīng)網(wǎng)絡(luò)，但無人取得重大突破，原因是它們過于簡單。這些新理論充其量只能解決部分問題，而對(duì)其他問題無能為力。我們不得不承認(rèn)，神經(jīng)網(wǎng)絡(luò)不能做邏輯推理。例如，在計(jì)算概率時(shí)，它無法理解數(shù)字的真正意義是什么。”

　　關(guān)于理想中的人工智能技術(shù)，他認(rèn)為重要的一點(diǎn)是使其具備常識(shí)性知識(shí)，而不僅僅是對(duì)圖像和語音的模式識(shí)別。在他看來，人工智能應(yīng)當(dāng)類似于人腦，而“人類解決問題的方式首先是具備大量常識(shí)性知識(shí)”。隨后，他還希望能實(shí)現(xiàn)《情感機(jī)器》一書中描述的思維體系結(jié)構(gòu)，使人工智能在各種思維方式間切換。

　　行業(yè)的發(fā)展并沒有按照明斯基的設(shè)想去推進(jìn)。被譽(yù)為當(dāng)前“人工智能三駕馬車”的辛頓、延恩·勒昆(Yann LeCun)和約書亞·本吉奧(Joshua Bengio)正受到業(yè)內(nèi)的追捧，而他們關(guān)注的領(lǐng)域均為深度學(xué)習(xí)。辛頓已加入谷歌，而勒昆則成為了Facebook的人工智能業(yè)務(wù)負(fù)責(zé)人。

　　2011年左右，谷歌啟動(dòng)了Google Brain項(xiàng)目，而最初的項(xiàng)目負(fù)責(zé)人吳恩達(dá)是深度學(xué)習(xí)領(lǐng)域的專家。利用來自YouTube的上千萬數(shù)字圖像，谷歌的神經(jīng)網(wǎng)絡(luò)進(jìn)行了自我訓(xùn)練，而學(xué)習(xí)效果超過了此前所有項(xiàng)目。由于YouTube上大量關(guān)于貓咪的影像，這一系統(tǒng)甚至自己學(xué)會(huì)了識(shí)別小貓。科學(xué)家將這種機(jī)制形容為大腦視覺皮層控制論的“表親”。這一實(shí)驗(yàn)采用了1.6萬顆處理器構(gòu)成的神經(jīng)網(wǎng)絡(luò)集群，但與人腦的數(shù)十億個(gè)神經(jīng)元相比，這只是九牛一毛。

2015年，谷歌公布了一系列圖像識(shí)別系統(tǒng)在深度學(xué)習(xí)過程中理解的圖片。谷歌的神經(jīng)網(wǎng)絡(luò)經(jīng)過自我訓(xùn)練，已經(jīng)學(xué)會(huì)準(zhǔn)確識(shí)別小貓的圖像。

　　利用深度學(xué)習(xí)技術(shù)，谷歌是否已踏上了“人工大腦”的道路？這個(gè)問題正引起越來越大的爭議。但業(yè)內(nèi)普遍認(rèn)為，深度學(xué)習(xí)技術(shù)幫助人工智能研究在視覺和語音領(lǐng)域取得了長足進(jìn)步。在硅谷，越來越多科學(xué)家和工程師認(rèn)為，深度學(xué)習(xí)將最終帶來“強(qiáng)人工智能”：機(jī)器的智慧水平將超過人類。

　　2013年，明斯基在麻省理工學(xué)院的學(xué)生、知名未來學(xué)家雷伊·庫茲韋爾(Ray Kurzweil)接替吳恩達(dá)，出任Google Brain項(xiàng)目負(fù)責(zé)人。在谷歌強(qiáng)大的神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上，庫茲韋爾的到來或許將可以幫助明斯基實(shí)現(xiàn)未盡的目標(biāo)。

　　人工智能的未來或許可以用明斯基2014年的一段話來總結(jié)：“如果你讓計(jì)算機(jī)自己待著，或是讓許多計(jì)算機(jī)待在一起，那么它們可能會(huì)試圖了解，它們從何而來，它們是誰。如果它們突然看到一本關(guān)于計(jì)算機(jī)科學(xué)的圖書，那么可能會(huì)嘲笑著說：‘這太假了。’而不同的計(jì)算機(jī)群體可能也會(huì)有不同想法。”

責(zé)任編輯：李英杰來源：新浪科技