來看看人工智能AI創造的精彩“世界”
文/驢打滾
第一次工業革命,18世紀60年代——19世紀中期,人類開始進入蒸汽時代。從此以后,人類的動力來源由當初的動物或者人變成了蒸汽機和煤炭,機械代替了手工作坊;
第二次工業革命,19世紀下半葉——20世紀初,人類進入電器時代,同時內燃機出現。電能的規模化使用,極大提高了生產效率;
第三次工業革命,20世紀四五十年代-至今,人類進入計算機時代,同時還出現原子能技術、航天技術、人工合成材料、分子生物學和遺傳工程等高新技術。計算機使信息數字化,推動智能化的發展;
第四次工業革命,正在發生,讓機器能夠模仿人類學習以及其他方面的智能,進行深度思考并且做出決策是第四次工業化革命最重要的事情。
來讓我們看看AI給我們帶來的精彩的世界。
人工智能的發展史與大事件
1956年8月,在美國漢諾斯小鎮寧靜的達特茅斯學院中,約翰·麥卡錫(JohnMcCarthy)、馬文·閔斯基(Marvin Minsky,人工智能與認知學專家)、克勞德·香農(ClaudeShannon,信息論的創始人)、艾倫·紐厄爾(Allen Newell,計算機科學家)、赫伯特·西蒙(HerbertSimon,諾貝爾經濟學獎得主)等科學家正聚在一起,討論著一個完全不食人間煙火的主題:用機器來模仿人類學習以及其他方面的智能。
會議足足開了兩個月的時間,雖然大家沒有達成普遍的共識,但是卻為會議討論的內容起了一個名字:人工智能。因此,1956年也就成為了人工智能元年。AI由此誕生,在隨后的日子里,AI成為實驗室的“幻想對象”。
受限于工業條件和認知程度,人工智能在此后近30年的時間里并沒有太大進步。直到上世紀90年代,人工智能才得到了突飛猛進的發展。
1997年,國際象棋程序“深藍”擊敗了世界冠軍卡斯帕羅夫,人工智能的“腦力”優勢現出端倪;
2007年,西洋跳棋程序奇努克正式將跳棋完成破解,最強大的跳棋高手在零失誤的情況下,也只能和奇努克打成平局;
2008年,在拉斯維加斯的德州撲克大賽中,人工智能“北極星2”依然在常規時間里輕松擊敗眾人;
2016年谷歌人工智能AlphaGo4:1戰勝韓國棋手李世石九段。
人工智能已然做到了顛覆人類認知。
AI發展史與大事件
人工智能的智能水平及算法
AI,機器來模仿人類學習以及其他方面的智能,展現人類的智力。
回到1956年夏天,在當時的會議上,AI先驅的夢想是建造一臺復雜的機器(讓當時剛出現的計算機驅動),然后讓機器呈現出人類智力的特征。
這一概念就是我們所說的“強人工智能Artificial General Intelligence (AGI)”,讓機器擁有人類的所有感知,甚至還可以超越人類感知,它可以像人一樣思考。
還有一個概念是“弱人工智能Artificial Narrow Intelligence (ANI)”。簡單來講,“弱人工智能”可以像人類一樣完成某些具體任務,有可能比人類做得更好,例如,Pinterest服務用AI給圖片分類,Facebook用AI識別臉部,阿爾法狗(AlphaGo)只會下圍棋。
“弱人工智能”實際使用的案例,這些應用已經體現了一些人類智力的特點。怎樣實現的?這些智力來自何處?帶著問題我們深入理解,就來到下一個圓圈,它就是機器學習,而如何實現機器學習呢?就是算法。機器學習就是用算法真正解析數據,不斷學習,然后對世界中發生的事做出判斷和預測。
算法
1、決策樹
分類決策樹模型是一種描述對實例進行分類的樹形結構。決策樹由結點和有向邊組成。結點有兩種類型:內部節點和葉節點,內部節點表示一個特征或屬性,葉節點表示一個類。
分類的時候,從根節點開始,對實例的某一個特征進行測試,根據測試結果,將實例分配到其子結點;此時,每一個子結點對應著該特征的一個取值。如此遞歸向下移動,直至達到葉結點,最后將實例分配到葉結點的類中。
舉一個通俗的栗子,各位立志于脫單的單身男女在找對象的時候就已經完完全全使用了決策樹的思想。假設一位母親在給女兒介紹對象時,有這么一段對話:
母親與女兒對話
這個女生的決策過程就是典型的分類決策樹。相當于對年齡、外貌、收入和是否公務員等特征將男人分為兩個類別:見或者不見。假設這個女生的決策邏輯如下:
決策流程
上圖完整表達了這個女孩決定是否見一個約會對象的策略,其中綠色結點(內部結點)表示判斷條件,橙色結點(葉結點)表示決策結果,箭頭表示在一個判斷條件在不同情況下的決策路徑,圖中紅色箭頭表示了上面例子中女孩的決策過程。
決策樹的應用用往往都是和某一應用分析目標和場景相關的,比如:金融行業可以用決策樹做貸款風險評估,保險行業可以用決策樹做險種推廣預測,醫療行業可以用決策樹生成輔助診斷處置模型等等,當一個決策樹的應用分析目標和場景確定,那該應用分析目標和場景所處的行業也就自然成為了決策樹的應用領域。
2、貝葉斯
貝葉斯的統計學中有一個基本的工具叫貝葉斯公式,又被稱為貝葉斯定理。如果你看到一個人總是做一些好事,則那個人多半會是一個好人。這就是說,當你不能準確知悉一個事物的本質時,你可以依靠與事物特定本質相關的事件出現的多少去判斷其本質屬性的概率。
用貝葉斯定理過濾垃圾郵件
全球垃圾郵件的高峰出現在2006年,那時候所有郵件中90%都是垃圾,2015年6月份全球垃圾郵件的比例數字首次降低到50%以下。
最初的垃圾郵件過濾是靠靜態關鍵詞加一些判斷條件來過濾,效果不好,漏網之魚多,冤枉的也不少。
利用貝葉斯定理過濾郵件,首先選正常郵件和垃圾郵件做訓練,兩種郵件數量越多之后效果越好,訓練的過程就是統計在垃圾郵件中出現過的所有詞匯的頻次,和正常郵件中出現的所有的詞匯的頻次。
因為典型的垃圾郵件詞匯在垃圾郵件中會以更高的頻率出現,所以在做貝葉斯公式計算時,肯定會被識別出來。之后用最高頻的15個垃圾詞匯做聯合概率計算,聯合概率的結果超過90%將說明它是垃圾郵件。
用貝葉斯過濾器可以識別很多改寫過的垃圾郵件,而且錯判率非常低。甚至不要求對初始值有多么精確,精度會在隨后計算中逐漸逼近真實情況
3、神經網絡
神經網絡是一門重要的機器學習技術。它是目前最為火熱的研究方向--深度學習的基礎。
圖1 神經細胞的結構
人類大約有幾百億個腦細胞,每個腦細胞大約有幾百條腦神經,每條神經上大約有幾百個突觸,每個突觸有幾百到幾千個蛋白質,一個腦細胞的作用大約相當于一臺大型計算機,一個突觸的作用大約相當于計算機的一塊芯片。可以很簡單地推算出來,人的大腦相當于上千億塊或上萬億塊芯片。
神經細胞和人身上任何其他類型細胞十分不同,每個神經細胞都長著一根像電線一樣的稱為軸突(axon)的東西,它的長度有時伸展到幾厘米,用來將信號傳遞給其他的神經細胞。神經細胞的結構如圖1 所示。它由一個細胞體(soma)、一些樹突(dendrite) 、和一根可以很長的軸突組成。神經細胞體是一顆星狀球形物,里面有一個核(nucleus)。樹突由細胞體向各個方向長出,本身可有分支,是用來接收信號的。軸突也有許多的分支。軸突通過分支的末梢(terminal)和其他神經細胞的樹突相接觸,形成所謂的突觸(Synapse), (圖中未畫出),一個神經細胞通過軸突和突觸把產生的信號送到其他的神經細胞。
有趣的事實
曾經有人估算過,如果將一個人的大腦中所有神經細胞的軸突和樹突依次連接起來,并拉成一根直線,可從地球連到月亮,再從月亮返回地球。如果把地球上所有人的腦中的神經細胞的軸突和樹突連接起來,則可以伸展到離開我們最近的星系!
神經細胞利用電-化學過程交換信號。輸入信號來自另一些神經細胞。這些神經細胞的軸突末梢(也就是終端)和本神經細胞的樹突相遇形成突觸(synapse),信號就從樹突上的突觸進入本細胞。信號在大腦中實際怎樣傳輸是一個相當復雜的過程,但就我們而言,重要的是把它看成和現代的計算機一樣,利用一系列的0和1來進行操作。就是說,大腦的神經細胞也只有兩種狀態:興奮(fire)和不興奮(即抑制)。發射信號的強度不變,變化的僅僅是頻率。神經細胞利用一種我們還不知道的方法,把所有從樹突突觸上進來的信號進行相加,如果全部信號的總和超過某個閥值,就會激發神經細胞進入興奮(fire)狀態,這時就會有一個電信號通過軸突發送出去給其他神經細胞。如果信號總和沒有達到閥值,神經細胞就不會興奮起來。
正是由于數量巨大的連接,使得大腦具備難以置信的能力。盡管每一個神經細胞僅僅工作于大約100Hz的頻率,但因各個神經細胞都以獨立處理單元的形式并行工作著,使人類的大腦具有下面這些非常明顯的特點:
能實現無監督的學習。 你不會給一個孩子看一萬輛車和一萬匹馬來讓他學會識別馬和車。在看到了一些例子后他就充分理解了兩者的不同。就是它們能夠自己進行學習,而不需要導師的監督教導。
Yann LeCun認為無監督學習才是人類和動物智能發展的主要途徑。從某種意義上,無監督學習讓人們看到了強人工智能的希望。
高度并行性,處理信息的效率極高。 由于人腦是超級巨大的并行運算系統,所有突觸以及每個突觸上的所有蛋白質,都可以瞬間同時運動,蛋白質之間又只有幾納米距離,電流在這個距離上一秒可運行幾千億次,人腦運算速度的數量級就大得沒法形容,大約1后面跟27個零到30個零。要知道,40億次,才不過是4后面跟9個零而已,差了大約20個數量級。
例如,大腦視覺皮層在處理通過我們的視網膜輸入的一幅圖象信號時,大約只要100ms的時間就能完成。考慮到你的神經細胞的平均工作頻率只有100Hz,100ms的時間就意味每秒只能完成10個計算步驟!想一想通過我們眼睛的數據量有多大,你就可以看到這真是一個難以置信的浩大工程了。
善于歸納推廣。 一種是形式化思維,是人腦演繹能力的表現,具有邏輯的循序的特點:一種是模糊性的思維,是人腦歸納能力的表現,可同時進行綜合的整體的思考。大腦和數字計算機不同,它極擅長的事情之一就是模式識別,并能根據已熟悉信息進行歸納推廣(generlize)。
例如,我們能夠閱讀他人所寫的手稿上的文字,即使我們以前從來沒見過他所寫的東西。
它是有意識的。人腦最獨特的是思維意識 ,意識(consciousness)是神經學家和人工智能的研究者廣泛而又熱烈地在辯論的一個話題。就目前的世界頂級科學家們也無法得知人的思維意識是怎樣產生的。可現在的電腦想要做到那種程度要過多長時間還是個未知數。而人腦和電腦最大的差別就在于,人腦的進化速度要比電腦的進化速度快多了。
因此,一個人工神經網絡( Artificial neural network, ANN)簡稱神經網絡(NN) 就是要在當代數字計算機現有規模的約束下,來模擬這種大量的并行性, 并在實現這一工作時,使它能顯示許多和人或動物大腦相類似的特性。
在某些領域,AI還是“打敗”了人類。深度神經網絡已經可以應用在交談、駕駛汽車,已經能夠打敗電子游戲和圍棋冠軍,還能利用其繪制圖片,并進行科學發現。
例如,圖片的設計和修改。在網站的更新和修改上,人工智能可以做得比人類更快速、更精準。這種基礎技術可以給出普通用戶對于網站樣式的意見,以告訴設計師這個網站設計得好不好。阿里的AI設計應用“魯班",現更名為“鹿班”,可謂讓設計師瑟瑟發抖。
4、深度學習
深度學習的概念源于人工神經網絡的研究。有了深度學習,機器學習才有了許多實際的應用,它還拓展了AI的整體范圍。 深度學習將任務分拆,使得各種類型的機器輔助變成可能。無人駕駛汽車、更好的預防性治療、更好的電影推薦要么已經出現,要么即將出現。AI既是現在,也是未來。有了深度學習的幫助,也許到了某一天AI會達到科幻小說描述的水平,這正是我們期待已久的。
AI是一個太龐大、太復雜的系統。AI給了世界,給了人們無限的想象空間和無線的可能。后面將會對AI的應用作一篇詳細的論述,讓我們繼互聯網+之后認識一下AI+。