驚世駭俗?人工智能完虐柯潔前你要知道這些事兒
【出品 | 網(wǎng)易智能 策劃/ 編譯| 秉翰 】去年三月一個會下圍棋的AlphaGo讓人工智能火了,今年三月準(zhǔn)備虐菜柯潔的AlphaGo增強(qiáng)版又會帶來什么?筆者的標(biāo)題可能起的有點(diǎn)穿越,但是柯潔就算最近閉關(guān)學(xué)會了新的獨(dú)門絕技,也不可能贏的了AlphaGo。圍棋人工智能的學(xué)習(xí)能力絕對超出人類幾個數(shù)量級。隨著時間的發(fā)展在圍棋這個項(xiàng)目上,無論是柯潔還是誰,人類只能越來越被完虐。這是“新進(jìn)化論”所帶來的不可阻擋的“自然”規(guī)律。
比賽以后的柯潔還能這么自信嗎?
然而,對于真正的人工智能來說,AlphaGo也只能是驚鴻一瞥,深度神經(jīng)網(wǎng)絡(luò)為人工智能帶來的是驚喜,但并不是變革。百度等公司全力“發(fā)神經(jīng)”對于他們商業(yè)上的成功也許并不能帶來什么助益。吳恩達(dá)帶著成千上萬塊GPU也許能為百度帶來一些令人驚喜的人工智能產(chǎn)品,卻難再現(xiàn)與莆田系印鈔般的盈利能力。人工智能只是完成了從胎兒到嬰兒的蛻變,降臨世上卻要經(jīng)歷無數(shù)艱險(xiǎn)才能為人。
然而,筆者并不是要吐槽目前各大公司面對人工智能大上快干的“神經(jīng)病”行為。而是深入淺出的分析讓人工智能驚艷世人的神經(jīng)網(wǎng)絡(luò)技術(shù),以及人工智能在現(xiàn)實(shí)商業(yè)層面所面臨的實(shí)際難題。讓大家觀摩柯潔與AlphaGo比賽之前來個熱身,科學(xué)客觀的看待人機(jī)大戰(zhàn)。
為什么神經(jīng)網(wǎng)絡(luò)火了?
神經(jīng)網(wǎng)絡(luò)這東西并不是新鮮事物,AlphaGo牛X之前,也只是人工智能各種算法的一個分支。神經(jīng)網(wǎng)絡(luò)中的很多算法已經(jīng)存在很多年,并不是突然之間像魔術(shù)那樣出現(xiàn)而不可思議。最近開始吸引焦點(diǎn),主要是因?yàn)榭捎玫挠?jì)算能力(CPU、GPU、AI專用計(jì)算單元)的快速發(fā)展,讓海量矩陣乘法運(yùn)算更容易被測試、驗(yàn)證和迭代。
但是Deepmind對AI下圍棋這塊的神經(jīng)網(wǎng)絡(luò)優(yōu)化確實(shí)讓人驚艷,而且Deepmind言之鑿鑿?fù)瑯拥募夹g(shù)完全可以應(yīng)用到其他領(lǐng)域。于是乎,不明真相的群眾們真的以為明天人工智能就要過來取代人類。各大互聯(lián)網(wǎng)公司也是順勢而為立即做起了人工智能生意。
筆者并不懷疑Deepmind神經(jīng)網(wǎng)絡(luò)算法的通用性,但是不同領(lǐng)域的訓(xùn)練數(shù)據(jù)獲取之于現(xiàn)實(shí)面還是無法解決的難題。而且某些領(lǐng)域數(shù)據(jù)的復(fù)雜度,也許只有量子計(jì)算才能在人類壽命可接受的范圍內(nèi)結(jié)束訓(xùn)練。
神經(jīng)網(wǎng)絡(luò)更像是打開圖靈難題的鑰匙
神經(jīng)網(wǎng)絡(luò)有兩大好處,一是利用相對長的應(yīng)用前訓(xùn)練時間換取了應(yīng)用中的處理實(shí)時性。而是用訓(xùn)練數(shù)據(jù)的處理復(fù)雜度換取了預(yù)設(shè)邏輯的處理復(fù)雜度。而且AlphaGo讓人們開始相信,也許神經(jīng)網(wǎng)絡(luò)真的是解決完全圖靈測試的鑰匙。
就宏觀的愿望來說,神經(jīng)網(wǎng)絡(luò)是期望通過模擬現(xiàn)實(shí)中的生物思維來直接實(shí)現(xiàn)人工思維。人工神經(jīng)網(wǎng)絡(luò)是對人腦完成特定任務(wù)或感興趣功能的方法進(jìn)行建模的自適應(yīng)機(jī)器,是一個由簡單處理元構(gòu)成的規(guī)模宏大的并行分布式處理器。天然具有存儲經(jīng)驗(yàn)和使之可用的特性。神經(jīng)網(wǎng)絡(luò)在兩個方面與人類相似:1、神經(jīng)網(wǎng)絡(luò)獲取的知識是從外界環(huán)境中學(xué)習(xí)得來的;2、互連神經(jīng)元的連接強(qiáng)度,即突觸權(quán)值,用于儲存獲取的知識。
現(xiàn)實(shí)生活中有很多問題并不能用預(yù)設(shè)邏輯來解決。當(dāng)問題不可預(yù)測,如在手寫字體識別;亦或處理的問題很容易變更需求;處理的任務(wù)只需要一個滿意解而不是精確解的時候,這些情況對于人腦的模糊邏輯處理來說不是問題,但對于計(jì)算機(jī)程序卻是難題。而神經(jīng)網(wǎng)絡(luò)通過已有大量可參考的經(jīng)驗(yàn)數(shù)據(jù),或者該任務(wù)自身能夠產(chǎn)生足夠的經(jīng)驗(yàn)數(shù)據(jù)來完成一個***解。它不保證任務(wù)完成的100%正確,但可以像人腦一樣給出一個經(jīng)驗(yàn)***解。從模仿人類思維的角度來說,人工智能可能是所有機(jī)器學(xué)習(xí)算法通用性***的一種,也是達(dá)陣圖靈測試的最有可能途徑。
神經(jīng)網(wǎng)絡(luò)解決一切? 那是在發(fā)神經(jīng)
但是很多情況神經(jīng)網(wǎng)絡(luò)并不是人工智能的***解決方案。什么問題都拿神經(jīng)網(wǎng)絡(luò)來套那是神經(jīng)病。這里可以舉個例子-基本的數(shù)字識別。
不管是神經(jīng)網(wǎng)絡(luò)還是基本的決策樹,亦或是向量機(jī),最根本的算法選擇原則還是能夠解決問題。很多產(chǎn)品處理都使用了熱門的遞歸神經(jīng)網(wǎng)絡(luò)算法,但是如果能用簡單的預(yù)設(shè)邏輯,貝葉斯算法以及向量機(jī)等可以達(dá)到很好的效果,也沒有必要本末倒置。深度神經(jīng)網(wǎng)絡(luò)很可能成為未來解決人工智能問題的通用算法,但是神經(jīng)網(wǎng)絡(luò)所需要的大量數(shù)據(jù)制備整理也是曠日費(fèi)時。神經(jīng)網(wǎng)絡(luò)相較于其他機(jī)器學(xué)習(xí)算法更像是用應(yīng)用前的大量數(shù)據(jù)凈化時間和訓(xùn)練時間來換取使用時的快速計(jì)算。
各種算法的性能比較,神經(jīng)網(wǎng)絡(luò)并不是***解。數(shù)據(jù)來源:(人工智能,Stuart-Russel)
這里羅列些常用的機(jī)器學(xué)習(xí)算法,由于過于枯燥不做具體展開。以間隔理論分布為基礎(chǔ):聚類分析和模式識別,人工神經(jīng)網(wǎng)絡(luò),決策樹,感知器,支持向量機(jī),集成學(xué)習(xí)AdaBoost,降維與度量學(xué)習(xí),聚類,貝葉斯分類器。
以構(gòu)造條件概率為基礎(chǔ):回歸分析和統(tǒng)計(jì)分類,高斯過程回歸,線性判別分析,最近鄰居法,徑向基函數(shù)核。
以概率圖模型為基礎(chǔ):包括貝葉斯網(wǎng)和Markov隨機(jī)場
近似推斷技術(shù):馬爾可夫鏈,蒙特卡羅方法(AlphaGo也用到該算法),變分法。
為何人工智能科學(xué)家提出了如此之多的方法?其實(shí)答案很簡單,沒有任何一種方法可以在任何場景中達(dá)到***解。神經(jīng)網(wǎng)絡(luò)火了,并不意味著未來人工智能就完全走向單一方向。神經(jīng)網(wǎng)絡(luò)配以其他方法輔助可能是更明智的選擇。
人工智能的變現(xiàn)難題
吳恩達(dá)2014年被百度招徠至麾下,百度開始了人工智能時代。你可以說百度一直在模仿谷歌,但是在人工智能這件事上,百度真的是挖來了谷歌大腦的核心人物。吳恩達(dá)在百度的3年時間里發(fā)表了近20篇論文,每項(xiàng)成果要么融入百度的已有產(chǎn)品線,要么依據(jù)成果成立一家初創(chuàng)公司。從吳恩達(dá)回到百度***個開發(fā)的醫(yī)療問診機(jī)器人到最近推出的語音識別開發(fā)平臺的喚醒二期產(chǎn)品,百度在人工智能領(lǐng)域的進(jìn)步有目共睹,雖然沒有Deepmind般驚世駭俗,但也成為業(yè)界執(zhí)牛耳者。
如今借著AlphaGo的東風(fēng),各種人工智能公司如雨后春筍般出現(xiàn)。不僅各種大數(shù)據(jù)公司搖身一變成為AI先鋒,就連依靠數(shù)據(jù)挖掘的媒體公司今日頭條也對外宣稱自己是一家人工智能公司。從外面看人工智能好似一座寶島,萬人爭過獨(dú)木橋只為在島上掘出什么寶貝來。但是橫亙在所有人工智能公司面前的***問題就是如何變現(xiàn)。回到現(xiàn)實(shí)層面,這座島上既沒有金子,也沒有銀子,看起來連塊像樣的石頭都沒有。
就拿百度舉個例子,吳恩達(dá)算是人工智能屆圖片識別領(lǐng)域的權(quán)威,然而恩達(dá)同志從未有過將產(chǎn)品商業(yè)化的成功案例。斯坦福做教授時靠學(xué)校養(yǎng)著,谷歌大腦期間當(dāng)然由廣告商養(yǎng)著,從來沒有任何變現(xiàn)壓力。來到百度之后,當(dāng)然產(chǎn)品化節(jié)奏有所加快,但也只能是被養(yǎng)著的節(jié)奏。比如2015年就已經(jīng)推出的百度問診機(jī)器人,推廣上遇到的問題還不算是問題,本來靠著百度那一套問診和賣藥的邏輯應(yīng)該有著不錯的前景,但是去年的魏則西事件基本將百度靠醫(yī)療暴力變現(xiàn)的邏輯徹底粉碎。于是,醫(yī)療事業(yè)部變成百度醫(yī)療大腦,問診機(jī)器人產(chǎn)品也只能成為雞肋。當(dāng)然,百度的一些語音產(chǎn)品在技術(shù)層面還是有著很好的toB前景的,但這種前景相比百度的體量和對人工智能的付出,前景也不可能變成錢景。
開復(fù)同志說的好,AI創(chuàng)業(yè)的核心是人工智能科學(xué)家,但還要有一群懂變現(xiàn)的人圍在旁邊。這個事本身很困難,因?yàn)橐褍扇和耆煌季S,而且成天價(jià)值觀不一樣每天打架的人放在一起。目前至少國內(nèi)的風(fēng)格是喜歡挖各種名校教授,有的基本不會編程,論文代碼都是下面學(xué)生實(shí)現(xiàn)的。本來人工智能變現(xiàn)就難,你還弄了一群不行就回學(xué)校教書的人那變現(xiàn)就好似天方夜談。
人工智能的到來不可阻擋,資本的進(jìn)入更會加快人工智能落地的進(jìn)程。但是,大風(fēng)吹起,想要落地就不是那么容易。人工智能的曙光就在不遠(yuǎn)處,但是前路漫漫,黑暗無窮無盡。怎么破?回去敲代碼,做優(yōu)化,一切還是產(chǎn)品說話。
作者介紹:劉秉翰,人工智能初創(chuàng)公司EditorAI CEO,作者自嘲“在人工智能領(lǐng)域最會寫文章,寫文章的里面最懂人工智能”。
聲明:本文為作者授權(quán)網(wǎng)易智能工作室獨(dú)家稿件,轉(zhuǎn)載請?jiān)谖氖鬃⒚鱽碓?ldquo;智能菌”、作者,以及標(biāo)注本文鏈接,違者必究。