人工智能那些事兒
在過去的250多年里,技術創(chuàng)新一直是經濟發(fā)展的根本推動力。這些技術創(chuàng)新中最重要的就是經濟學家所說的“通用技術”,包括蒸汽機、電力,以及內燃機。它們中的每一個都催化了互補性創(chuàng)新與機遇的浪潮。舉例來說,內燃機讓汽車、卡車、飛機、鏈鋸、割草機,甚至大型零售商、購物中心、交叉對接倉庫、新供應鏈以及郊區(qū)得以出現。像沃爾瑪、UPS和Uber這樣擁有多樣性的公司找到了利用新技術創(chuàng)造新商業(yè)模式的方法。
我們這個時代最重要的通用技術就是人工智能,尤其是機器學習,也就是說機器能夠持續(xù)提高自己的性能,而無須人類明確解釋所有這些任務要怎樣完成。在過去幾年的時間里,機器學習已經變得越來越高效和廣泛地使用。我們現在已經能建造出自己學習如何完成任務的系統了。
為什么這件事非常重要呢?有兩個原因。第一,人類的知識比我們能表達出的更多,我們不能解釋為什么人類能完成那么多的事情,從識別出一張人臉到在古老的亞洲策略游戲圍棋中走出絕妙的一招。在機器學習之前,我們無法精確表達出我們的知識,這種無能正意味著我們不能自動化很多事情,而現在我們可以做到了。
第二,機器學習系統是非常出色的學習者。這些系統能在廣泛的領域中達到超人類性能,包括檢測欺詐和診斷疾病等。人們在整個經濟領域中都部署了這樣出色的數字學習者,它們的影響力將會十分深刻。
在商業(yè)領域,人工智能在早期通用技術的階段就被認為擁有變革性的影響。雖然它目前已經被應用于全球上千家公司,但大多數重大的機遇并沒有被利用開發(fā)出來。隨著制造業(yè)、零售業(yè)、交通運輸、金融業(yè)、醫(yī)療保健行業(yè)、法律、廣告業(yè)、保險業(yè)、娛樂、教育業(yè),以及事實上每一個其他領域轉變其核心進程和商業(yè)模式,并從機器學習中受益,人工智能的影響,在即將到來的這個十年中一定會被放大。現在的瓶頸在于管理、執(zhí)行,以及商業(yè)想象力。
然而,就像很多其他新技術一樣,人工智能也催生出了一大批不切實際的期望。我們看到有大量商業(yè)計劃隨意揮灑在機器學習、神經網絡,以及各種其他形式的技術方面,但卻幾乎與其真正的功能沒有聯系。舉個例子來說,簡單地把一個約會網站叫做“人工智能驅動的網站”,并不能讓它變得更高效,但那或許有助于網站融資。這篇文章將穿過這些喧囂的噪音,描述出人工智能的真正潛力、它的實踐意義,以及它在被采用的過程中面臨的障礙。
人工智能今天能夠做些什么?
“人工智能”這個詞是1955年由約翰·麥卡錫(John McCarthy)創(chuàng)造的,麥卡錫是達特茅斯學院的一位數學教授,他組織了之后一年那場具有開創(chuàng)意義的人工智能大會。從那以后,也許部分原因是因其令人回味的名稱,人工智能這個領域開始崛起,而不僅僅停留在夢幻般的主張和承諾上了。在1957年,經濟學家赫伯特·西蒙(Herbert Simon)預測,十年之內,計算機將在國際象棋方面打敗人類。(事實上,計算機只花了40年時間。)在1967年,認知科學家馬文·明斯基(Marvin Minsky)說:“在一代人之內,創(chuàng)造‘人工智能’這個問題將會得到實質解決。”西蒙和明斯基二人都是知識分子中的巨擘,但他們都錯了。所以,對未來突破的戲劇性主張遭到了一定程度的懷疑。
我們先來看看,人工智能現在在做些什么,以及它在以多快的速度發(fā)展。最大的兩個進步發(fā)生在這樣兩個廣闊的領域:感知和認知。在早期的分類中,最有實用性的進步都是跟語音有關的。語音識別還差強人意,但現在有百萬計的人們在使用它,想想Siri、Alexa,以及Google的語音助手。你現在在讀的這篇文章,最開始是我口述給一臺計算機并讓它以足夠的精確度轉寫出來的,這樣比打字要快。由斯坦福計算機科學家詹姆斯·蘭迪(James Landay)和他的同事們進行的一項研究發(fā)現,平均來說,語音識別比在手機上打字要快三倍,其錯誤率已經由曾經的8.5%降低到了4.9%。令人震驚的是,這個顯著的改進并不是經過10多年時間才實現的,而僅僅是從2016年夏天才開始。
同樣地,圖像識別也進步得非常驚人。你可能已經注意到,Facebook和其他應用程序現在可以在發(fā)出的圖片中識別出你很多朋友的臉,并且提示你給他們貼標簽。一個在你智能手機上的應用就能識別出野外的任何一只鳥。在一些公司總部,圖片識別甚至正在取代身份證件。視覺系統,比如那些用在自動駕駛汽車上的視覺系統,以前在識別行人方面每30幀中就會出現一次錯誤,而現在它們的錯誤率比在3000萬幀中出錯一次還要低。圖片識別有一個巨大的數據庫,叫ImageNet,它擁有幾百萬常見的、模糊的或完全怪異的照片,頂級系統的圖片識別錯誤率已經從2010年的30%多,降低到了2016年的4%。
最近幾年來,由于采用了基于龐大的或“深度的”神經網絡的新方法,圖片識別的改進速度迅速加快。視覺系統的機器學習還遠非完美,但即使是人類,也可能會在快速識別出一只小狗方面有困難,人們也可能會在根本沒有可愛小狗的地方看出小狗來。
小狗還是瑪芬蛋糕?圖像識別的進步
機器已經在識別相似圖像的類別方面取得了長足的進步。
圖片識別的錯誤率
第二個主要改進的方面是認知和問題解決。機器已經戰(zhàn)勝了最棒的人類撲克選手和圍棋選手,這是一項專家們之前預測需要至少又一個十年的時間才能實現的成就。Google的DeepMind團隊用機器學習系統提高冷卻數據中心的效率,高達15個百分點,即使人類專家已經優(yōu)化過數據中心,它也還是達到了這個水平。網絡安全公司Deep Instinct正在使用智能代理來檢測惡意軟件,PayPal用智能代理防止洗錢行為。使用IBM技術的一家新加坡保險公司支持用戶自動進行索賠流程,而數據科學平臺Lumidatum能提供實時建議來改進客戶支持系統。一大批公司在使用機器學習來決定接受華爾街的哪一筆買賣,有越來越多的信用決策都在機器學習的幫助下做出。亞馬遜采用機器學習優(yōu)化庫存并改善他們向用戶推送的產品推薦。Infinite Analytics開發(fā)了一個機器學習系統,來預測用戶是否會點擊一個特定的廣告,改善全球消費品商品公司的在線廣告布局,另一個系統則是為了優(yōu)化用戶在一個巴西網絡零售商的搜索和發(fā)現過程。第一個系統將廣告投資回報率提高了三倍,第二個系統則增加了1.25億美元的年收入。
機器學習系統不僅在很多應用里代替著原始的算法,而且在很多人類曾經表現最好的工作任務中更為出色。雖然這個系統還有待改進,它們在ImageNet數據庫的錯誤率(大約是5%)已經達到或比人類水平的表現更好了。語音識別也是這樣,即使在嘈雜的環(huán)境下,現在也幾乎和人類水平持平。機器學習系統達到了這樣的門檻,進而為改變工作場所和經濟開辟出了新的廣闊可能性。一旦以人工智能為基礎的系統在某個領域超越了人類的表現,它們就更容易快速廣泛傳播。舉個例子,比如Aptonomy和Sanbot,它們分別是無人機和機器人制造者,它們正在使用改進過的視覺系統,使很多安保工作自動化。在很多同類公司中,軟件公司Affectiva正在使用機器學習在特定群體中識別快樂、驚訝和氣憤等情緒。Enlitic則是一家使用機器學習掃描醫(yī)學圖像進而幫助診斷癌癥的深度學習創(chuàng)業(yè)公司,而這樣的公司已經有好幾家了。
這些都是了不起的成就,但以人工智能為基礎的系統,其適用性依然非常狹窄。舉個例子,機器學習在擁有數百萬圖片的ImageNet數據庫中的出色表現,并不意味著它總能“在野外環(huán)境中”取得一樣的成功,在野外環(huán)境中,光線條件、角度、圖片分辨率以及情境都可能非常不同。更為根本地,我們可能會驚嘆于一個系統能理解中國話并把它翻譯成英文,但我們不能指望這個系統理解一個特定中文字的意義,更不用說在北京去哪里吃飯好了。如果一個人能出色地完成一項任務,那很自然也可以假設他有能力完成一些相關的工作。但是機器學習系統就是為了某些特定任務而訓練出來的,它一貫的知識并不會擴展延伸。一個典型的謬論就是認為計算機狹窄的理解力意味著它能擴展到更廣闊的理解力中,這可能是一個最大的混淆之源,更為夸張的宣稱就是認為人工智能能夠自己取得進步。我們離具備在多領域中擁有通用智能的機器還非常遙遠。
理解機器學習
要理解機器學習,最重要的一點就是明白機器學習代表了一條創(chuàng)造軟件的完全不同的道路。舉個例子,機器是去學習一件事情,而不是為某一明確結果被明確編程成什么樣子。在過去50年的絕大多數時間里,信息技術領域的進步及其應用都聚焦于把某種已有的知識和程序編成指令,再把這些指令植入機器中。確實,“編程”這個詞總是意味著這樣一種艱苦的過程,即開發(fā)者把自己頭腦中的知識轉化成一種機器能理解和執(zhí)行的格式。這種方法有一個根本上的弱點:我們現有的很多知識都是大家心照不宣的,也就是說我們無法完全解釋它們。對我們來說,寫下每一條指令讓另一個人明白如何騎自行車、如何識別出一個朋友的臉龐,這幾乎是不可能的。
上圖:這就是使用人工智能的意義。結果是人又不是人,可識別但又不是你期望中的那樣,它們美麗嗎,可怕嗎,能讓人感到愉悅嗎?
換句話說,我們所知的比我們能表達的更多。機器學習正在克服這個困難。在第二次機器革命的這第二波浪潮中,人類制造的機器正在從實例中學習,并且使用結構清晰的反饋來解決自己的問題,比如面部識別。
機器學習的不同特色
人工智能和機器學習有很多種特色,但近年來大多數成功的案例都集中在監(jiān)督學習方面,也就是關于某特定問題,賦予機器大量正確的實例學習。這個過程幾乎總涉及從一組輸入X,到一組輸出Y的映射。比如,輸入可能是一些各種動物的圖片,正確的輸出就是關于這些動物的標簽:貓、狗、馬等。輸入也可以是一段音頻的聲音波形,正確的輸出就是一些詞匯:是、否、你好、再見等。
成功的系統通常使用幾千個甚至幾百萬個實例的訓練數據集,每個實例都已經被標記出正確的答案,系統會再大體看一下新的實例,如果訓練順利,系統就會以高度的精確度來預測答案。
算法的成功多半要依仗一種叫“深度學習”的方式,而深度學習利用的是神經網絡。和早期機器學習算法相比,深度學習算法有一個重要的優(yōu)點:深度學習能夠更好地使用大得多的數據庫。舊的系統會隨著訓練數據實例的增加而改進,但會到達一個點,在那個點之后再增加數據并不能帶來更好的預測。這個領域的領軍人之一吳恩達說:“深度神經網絡就不會在這種方式下失效,更多的數據的確會帶來更好的預測。”一些非常大的系統是由3600萬或更多實例訓練出來的。當然,要使用極大的數據庫就需要更加強大的處理能力,這就是為什么非常大的系統通常在超級計算機或專用計算機上運行。
如果你有很多有關行為的數據并試圖預測結果,這就是監(jiān)督學習系統的潛在應用機會。亞馬遜的全球消費者部門的CEO杰夫·威爾克(Jeff Wilke)說:“監(jiān)督學習系統已經在很大程度上取代了用于向客戶提供個性化建議的基于內存的過濾算法。”摩根大通則引入了一個系統來檢查商業(yè)貸款合同,這項工作以前需要負責貸款的員工用360000個小時來完成,而現在只需要幾秒鐘了。監(jiān)督學習系統還被用于診斷皮膚癌。上面所說的只是部分例子而已。
相對來說,標記一組數據并把它用于訓練監(jiān)督學習系統是比較簡單直接的。這也是為什么監(jiān)督學習式機器學習系統比無監(jiān)督學習系統更為常見,至少目前是如此。無監(jiān)督學習系統想要自己學習。我們人類就是出色的無監(jiān)督學習者,我們用很少的沒有標簽的數據就能從這個世界上獲取大部分知識,比如識別出一棵樹,但是開發(fā)出一個如此運行的成功的機器學習系統就極端困難。
如果我們能建立強大的無監(jiān)督學習系統,就將開啟令人振奮的新的可能性。這些機器將能夠用全新的方法審視復雜的問題,幫我們找出其中的模式,可用于觀察疾病傳播、市場證券價格走勢、客戶的購買行為等等。正是這種可能性引領著Facebook的AI研究主管、紐約大學教授 Yann LeCun,他把監(jiān)督學習系統比作在蛋糕上撒糖霜,而把無監(jiān)督學習比作蛋糕本身。
在這個領域里,另一個渺小但是在成長中的領域就是強化學習。它已經被嵌入了雅達利電子游戲和圍棋這樣的棋盤游戲中。它還能幫助優(yōu)化數據中心的電力使用,甚至為股票制定交易策略。Kindred公司制造的機器人能用機器學習來辨識和歸類它們從沒遇到過的物體,還能加快消費品配送中心的運送速度。在強化學習系統中,編程人員會具體說明系統的現狀和目標,列出可被允許的行為,描述會影響和限制行為結果的環(huán)境因素。在可被允許的行為下,系統要找出盡可能接近目標的方法。人類可以具體說明目標而不需要說明如何做到,在這種情況下系統運行得最好。比如,微軟利用強化學習來為MSN網站的新聞報道選標題,方法就是在點開鏈接的用戶更多的時候,給系統打更高的分數作為獎勵。系統會嘗試著在編程人員給定規(guī)則的基礎上最大化它的分數。當然,這就意味著強化學習系統會針對你明確獎勵的目標進行自身優(yōu)化,而不一定針對你真正關心的目標來優(yōu)化,因此,準確而清晰地指定目標至關重要。
上圖:今天的人工智能應用都是由人類來驅動的,醫(yī)生嘗試著去解決一個癌癥患者的病痛,家庭廚師在尋找新的菜譜,通勤上班族決定著如何開車出門。
把機器學習帶入工作中
對那些期望把機器學習付諸實踐的組織來說,現在有三個好消息。第一,人工智能在廣泛地傳播。這個世界上還遠沒有足夠的數據科學家和機器學習專家,但在線教育資源和大學院校正在努力迎合這種需求。其中最好的資源包括Udacity、Coursera和fast.ai,他們不僅教授概念性的東西,而且能真正讓學生們去實現工業(yè)級別的機器學習部署。除了培養(yǎng)自己的員工之外,感興趣的公司還可以利用Upwork、Topcoder和Kaggle這樣的在線人才平臺尋找具備專業(yè)知識的機器學習專家。
第二,對現代人工智能來說十分必要的算法和硬件已經可以被買到或租賃到。Google、亞馬遜、微軟和Salesforce等公司都在建構強大的機器學習基礎設施,并且都可以通過云系統得到。在這些競爭對手之間存在激烈的競爭,這就意味著,隨著時間推移,那些想要嘗試和部署機器學習的公司將看到越來越多可獲得的平價功能。
第三,也許你并不需要那么大量的數據才能開始利用機器學習。大多數機器學習系統的表現都會隨著它們得到更多數據而提升,所以,似乎擁有最多數據的公司將會取得勝利。在這種情況下,“勝利”意味著“控制某一單一應用,比如廣告定位或者語音識別的全球市場”。但如果勝利的定義被轉變?yōu)?ldquo;顯著提高性能”,那么其實充足的數據是非常容易獲得的。
機器學習正在三個層面推動變革:任務和職業(yè)、商業(yè)進程、商業(yè)模式。用機器視覺系統識別出潛在的癌細胞就是第一個層面變革的極好例證,它把放射學家解放出來,讓他們能夠專注于真正重要的事情,能夠更好地和病人溝通,和其他醫(yī)生協作。對商業(yè)進程的變革也有一個例子,就是亞馬遜引入了機器人,并使用以機器學習為基礎的優(yōu)化算法,重新發(fā)明了工作流程,重新布局了亞馬遜的各個履職中心。同樣地,商業(yè)模式也需要利用機器學習系統來重新思考,這些系統可以智能地定制化地推薦音樂、電影等。更好的模式不是以消費者選擇為基礎銷售單曲,而是提供一種預訂和播放特定用戶可能會喜歡的音樂這樣一種個性化訂閱服務,即使這個用戶可能根本沒聽說這些音樂。
風險和極限
第二次機器革命的第二波浪潮也帶來了新的風險。尤其是,機器學習系統是“難以解釋的”,也就是說我們人類很難理解系統是如何作出決定的。深度神經網絡可能擁有數億個連接,每一個連接都為最終的決策貢獻了一點力量。結果就是這些系統的預測是無法簡單明晰地被解釋出來的,機器知道的比它們能告訴我們的更多。
這就帶來了三個方面的風險。第一,機器可能會有隱藏的偏見,這些偏見不是來自機器設計者的意圖,而是來自訓練它們的數據。比如,如果一個系統利用人類數據庫的決策學習可以接受面試中的哪些工作申請,它可能會不經意間評估應聘者的種族、性別、民族等。更進一步,它們的偏見可能不會表現成明確的規(guī)則,而是嵌入在上千種考慮因素的細微互動之中。
第二,與建立在明確邏輯規(guī)則上的傳統系統不同,神經網絡系統處理的是數據事實,而不是絕對的事實。可能很難證明這個系統是完全確定可以在任何情況下正常工作,尤其是在訓練數據時沒有涉及到的情況下。缺乏確定性可能是在處理關鍵任務時的一個問題,比如控制核電廠,或者涉及生死攸關的決定。
第三,當機器學習系統犯錯的時候(犯錯幾乎不可避免),診斷和糾正錯誤都極端困難。得出解決方案的基礎結構可能是我們難以想象地復雜的,如果系統的訓練條件改變了,得出的解決方案可能遠非最優(yōu)。
這些風險都非常真實,合適的基準不是追求完美,而是追求最優(yōu)的可選項。畢竟我們人類也會有偏見、犯錯誤,還覺得誠實解釋我們做出決定的過程很困難。以機器為基礎的系統,其優(yōu)點在于它可以隨著時間推移而改進,而且你給它什么樣的數據它都會得出一致的回答。
這是否意味著人工智能和機器學習能做的事情就沒有極限呢?感知和認知覆蓋了絕大部分的領域,從開汽車到預測銷售,甚至還能決定雇傭什么人、提拔什么人。我們相信,在絕大多數領域,人工智能很快就會超越人類水平的表現。那么,人工智能和機器學習不能做什么呢?
我們有時會聽到這樣的說法:人工智能永遠無法估計評估我們這些情緒化的、靈巧的、狡猾的人類,它太呆板太非人化了。我們不同意這樣的說法。在通過聲音語氣、面部表情來識別一個人的情緒狀態(tài)方面,機器學習系統已經處于或者已經超越了人類水平的表現。有些系統甚至能識別世界最頂級的撲克選手是否在虛張聲勢。這是一個非常精細的工作,但它不是魔法。它需要知覺和認知,這正是機器學習現在正變得越來越強大的地方。
討論人工智能的極限,最好從畢加索開始,畢加索通過對計算機的觀察得出結論:“它們沒有用,它們只能給你答案罷了。”事實上,計算機當然不是沒有用,但是畢加索的觀察依然提供了某些洞見。計算機是用來回答問題的設備,而不是提出問題的設備。那就意味著,企業(yè)家、創(chuàng)新者、科學家、創(chuàng)造者和其他那些尋找下一個問題與機會的人,那些探索新領域的人,他們依然至關重要。
我們認為,在這個超級強大的機器學習時代,對人類智慧來說,最大最重要的機遇在于兩個領域的交叉:弄清楚下一步要解決什么問題,說服很多人解決這個問題,一起去尋求解決方案。這也是對“領導力”的一種合適的定義,而領導力已經在第二機器時代變得越來越重要了。
我們認為,人工智能,尤其是機器學習,這些是我們這個時代最重要的通用技術。這些創(chuàng)新對企業(yè)和經濟的影響不僅僅體現在它們的直接貢獻中,而且還體現在它們啟發(fā)互補創(chuàng)新的能力方面。通過更好的視覺系統、語音識別、智能解決問題系統,以及由機器學習所提供的很多其他功能,新的產品和流程正在成為現實。
雖然預測具體地哪個公司會在新環(huán)境中居于統治地位很難,但一個通用的原則很明晰,那就是:最為靈活的、有適應能力的公司和經營管理者會走向繁榮。能迅速感知到機遇,并對此有所反應的組織,終將會在人工智能這片熱土上占據優(yōu)勢。所以成功的策略就是,樂于快速實驗并學習。如果管理者們沒有在機器學習領域開展實驗,那么他們就沒有做好自己的工作。在未來的十年時間里,人工智能并不會取代管理者,但是,那些善用人工智能的管理者將會取代那些沒有這樣做的人。
上圖:仔細凝視,你將會看到算法中的人類;更仔細地凝視一會兒,你將會看到智能中的算法。