五分鐘向長輩解釋機器學(xué)習(xí),這樣特別通俗!
什么是機器學(xué)習(xí)呢?如果是對此一竅不通的長輩來問你這個問題,你該如何回答?本文將用最簡單的詞匯來嘗試解釋這一話題,包括每個人都應(yīng)該知道的最主要也是最重要的部分。
機器學(xué)習(xí)是一個旨在讓計算機在沒有被明確編程的前提下掌握學(xué)習(xí)能力的研究領(lǐng)域。這是一個正在迅速成長的領(lǐng)域,可以讓計算機進(jìn)一步模仿人類。
機器學(xué)習(xí)不同于傳統(tǒng)計算機科學(xué)。在傳統(tǒng)中,計算機需要程序員準(zhǔn)確地告訴它去做什么以及要怎么做,可以說是非常笨拙了。然而有了機器學(xué)習(xí),我們只需要在計算機中輸入大量數(shù)據(jù),就可以進(jìn)行分析,并輸出結(jié)果了。
比如說,你知道怎么在Facebook上發(fā)布照片吧。當(dāng)你發(fā)布照片時,F(xiàn)acebook會提醒你標(biāo)記一些可能在照片中出現(xiàn)了的人。如果你不了解Facebook,那么再舉一個更常見的例子,你在瀏覽Netflix時,網(wǎng)頁會推薦一些可能喜歡的劇集或電影。其實,這就有點機器學(xué)習(xí)的意味了。
再比如說,機器學(xué)習(xí)在自動駕駛汽車上發(fā)揮著重要作用。汽車會收集大量的數(shù)據(jù)來學(xué)習(xí)怎樣開得更好更安全。顯而易見的是,機器學(xué)習(xí)將在未來的生活中扮演重要的角色。
機器學(xué)習(xí)不是什么
首先,機器學(xué)習(xí)并不是像你在電影中看到的那樣,機器人想要摧毀人類。當(dāng)人們聽到人工智能時,往往首先會想到“終結(jié)者”。其實,機器學(xué)習(xí)并不是人工智能,它只是人工智能的一個子領(lǐng)域。機器學(xué)習(xí)已經(jīng)經(jīng)過了相當(dāng)長一段時間的發(fā)展。其起源可以追溯到上世紀(jì)50年代晚期。當(dāng)時,IBM的亞瑟·塞繆爾(Arthur L. Samuel)設(shè)計了第一款會下西洋棋的機器學(xué)習(xí)應(yīng)用。
解釋邪惡人工智能時“必備”的終結(jié)者圖片
深度學(xué)習(xí)可能是你經(jīng)常聽到的另一個時髦詞匯。深度學(xué)習(xí)的發(fā)展歷史和機器學(xué)習(xí)一樣長,但是直到上世紀(jì)80年代深度學(xué)習(xí)才得到廣泛重視。最終,世界科技巨頭如Facebook、谷歌和微軟紛紛大力投資深度學(xué)習(xí)的發(fā)展,繼而引發(fā)了人工智能革命。谷歌翻譯、蘋果智能助手Siri等等,都是深度學(xué)習(xí)的產(chǎn)物。
請放心,在可以預(yù)見的未來,即使機器學(xué)習(xí)或人工智能的發(fā)展失去控制,也不會對人類社會造成威脅。
怎樣讓機器學(xué)習(xí)
看到這里,你可能在想,那么到底是怎樣讓機器學(xué)習(xí)的呢?計算機是怎樣收集并理解信息的呢?其實,在這一過程中,我們會利用很多數(shù)學(xué)算法來幫助得到想要的結(jié)果。
1. 機器學(xué)習(xí)中的數(shù)學(xué)
線性代數(shù)是數(shù)學(xué)的一個研究領(lǐng)域,被公認(rèn)為是深入了解機器學(xué)習(xí)的前提。線性代數(shù)的內(nèi)容非常廣泛,包含很多晦澀難懂的理論和發(fā)現(xiàn)。但是其基本方法和符號對機器學(xué)習(xí)研究者來說是非常有用的。所以,需要有堅實的線性代數(shù)知識作為基礎(chǔ)。
數(shù)學(xué)對學(xué)習(xí)機器學(xué)習(xí)來說是極其重要的,因為我們需要在選擇算法時考慮其準(zhǔn)確性、訓(xùn)練時間以及其他性能。數(shù)學(xué)可以幫助我們找到一種讓機器學(xué)習(xí)的最佳方法。除了線性代數(shù),機器學(xué)習(xí)科學(xué)家/工程師也需要掌握微積分、算法、概率論和統(tǒng)計學(xué)等數(shù)學(xué)概念。在機器學(xué)習(xí)中,Python是最常用的一種編程語言。
2. 聯(lián)想到大腦
大腦會將世界上各種各樣的信息收集起來形成我們對現(xiàn)實的看法。計算機也需要做到這一點。神經(jīng)網(wǎng)絡(luò)就承擔(dān)了這一職責(zé)。
神經(jīng)網(wǎng)絡(luò)是讓計算機模擬人類大腦最常用的方法。人類大腦由將近10億個神經(jīng)細(xì)胞,也就是神經(jīng)元構(gòu)成。人類大腦非常擅長解決問題。在解決問題時,每個神經(jīng)元都會負(fù)責(zé)解決其中的一小部分。這些神經(jīng)元可以收集和傳遞信號,就像一個電網(wǎng)。
3. 人類大腦神經(jīng)元
在知道了計算機神經(jīng)網(wǎng)絡(luò)是受到人類大腦結(jié)構(gòu)啟發(fā)設(shè)計的之后,你可能想知道這些神經(jīng)元是怎么連接在一起的。每個神經(jīng)元都會接收輸入,然后產(chǎn)生輸出。輸入節(jié)點(輸入層)為神經(jīng)網(wǎng)絡(luò)提供來自外界的信息,就好比是你的眼睛看到并收集信息后傳遞給大腦。
輸出節(jié)點(輸出層)則負(fù)責(zé)將信息反饋給外界。假設(shè)下圖中的網(wǎng)絡(luò)將被訓(xùn)練用來識別數(shù)字。一個數(shù)字從輸入層輸入,經(jīng)過隱藏層,然后在輸出層以被識別出的數(shù)字輸出。隱藏層的神經(jīng)元會互相交流各自獲取的信息。它們利用這些信息來識別輸入的數(shù)字是什么。每一層都會影響到下一層。
當(dāng)訓(xùn)練計算機神經(jīng)網(wǎng)絡(luò)做其他事情,比如說音頻識別時,則更為神奇。計算機可以學(xué)習(xí)對演講進(jìn)行文法分析、分段音頻以及篩選出不同的聲音。這些聲音被組合起來,構(gòu)成特定的音節(jié)、單詞、詞組等。在構(gòu)建網(wǎng)絡(luò)時,你需要知道:
- 卷積網(wǎng)絡(luò)往往用來做圖像識別
- 長短時記憶網(wǎng)絡(luò)往往用來做演講識別
機器學(xué)習(xí)還有多種方法,比如監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)和強化學(xué)習(xí),是經(jīng)常使用的三種方法。本文不再詳述。簡單來說,神經(jīng)網(wǎng)絡(luò)使得計算機能夠接收信息,將信息分成易于理解的部分,最后輸出它能得出的最接近的結(jié)果。
挑戰(zhàn)與局限性
雖然機器學(xué)習(xí)非常強大,但仍有很多局限性,克服這些局限性將幫助機器學(xué)習(xí)技術(shù)更上一層樓。
首先,機器學(xué)習(xí)算法需要大量的存儲數(shù)據(jù)用于訓(xùn)練,而給這些數(shù)據(jù)做標(biāo)記是一個非常繁瑣的過程。輸入機器的數(shù)據(jù)必須是被標(biāo)記過的,否則機器將無法變得智能。算法僅能開發(fā)機器的決策能力,并與其按要求操縱的環(huán)境保持行為一致。
另一個問題就是機器無法解釋它自己。這就使得你很難知道它為什么做出某個決定。
最后一個也是最重要的一個局限性就是很難避免偏差。透明性至關(guān)重要,公正的決策可以幫助建立信任。比如說,面部識別在社交媒體和執(zhí)法中發(fā)揮著重要的作用。但是面部識別提供的數(shù)據(jù)集中的偏差會使得結(jié)果不準(zhǔn)確。如果說算法有偏差,并且數(shù)據(jù)集和訓(xùn)練數(shù)據(jù)是不平衡的,那么最終輸出的結(jié)果將會放大數(shù)據(jù)集中的區(qū)別和偏差。
未來是機器的
機器學(xué)習(xí)是人工智能發(fā)展的基礎(chǔ),它的未來是不可阻擋的。機器學(xué)習(xí)已經(jīng)成為了現(xiàn)代生活的一部分。
如果你使用Spotify聽音樂,你會發(fā)現(xiàn)它會根據(jù)你聽的歌曲給你做每日推薦。亞馬遜也會根據(jù)客戶的購物習(xí)慣,學(xué)習(xí)如何給客戶推薦他們可能感興趣的商品。類似于亞馬遜的Alexa,蘋果的Siri以及微軟的Cortona這樣的虛擬助理,都是基于機器學(xué)習(xí)來理解人們說的話并和他們交互的。
機器學(xué)習(xí)在商業(yè)中也得到了廣泛應(yīng)用。它可以自動化一些通常需要人類操作的工作。很多公司會在客戶服務(wù)部門使用聊天機器人和服務(wù)機器人。這些機器人會學(xué)習(xí)如何回復(fù)客戶,為客戶提供智能化的、有用的幫助。
還有機器學(xué)習(xí)在自動駕駛汽車和卡車上的應(yīng)用。車輛需要學(xué)會識別路上的障礙物,如停車標(biāo)志、暴風(fēng)雪、路中間的球、其他車輛等,并做出相應(yīng)的反應(yīng)。收集的信息越多,它們就表現(xiàn)得越像人類。比如說,它們可以識別出一個被雪覆蓋的停車標(biāo)志。
機器學(xué)習(xí)可以讓我們的生活變得更加便利。人們不斷地提出各種利用機器學(xué)習(xí)的方法,一場工業(yè)革命正在悄然發(fā)生。至于當(dāng)機器學(xué)習(xí)逐漸引導(dǎo)我們走向真正的人工智能技術(shù)時,人類的生活會變成什么樣,只能靠想象了。