算法王國,中國可能實現彎道超車
今年年初,兩件事吸引到那些正持續關注全球人工智能發展的人們。其一是微軟的高管陸奇在 1 月表示,自行車事故之后,他將不再回到這家全球最大的軟件公司任職,而將擔任中國最大的搜索引擎公司——百度的首席運營官。而第二件則是該月末,由于 AAAI (國際人工智能協會)年會的原定日期與中國春節相沖突,最終將會議推遲。
這些跡象表明,在一些人工智能至關重要的領域,中國有可能實現彎道超車,比如語音助手、自動駕駛汽車等。陸奇解釋道,中國就是這樣的地方,而百度也是最為重要的參與者。他說:「我們有機會領導人工智能的未來」。事實證明他所言不虛。2016 年 10 月,白宮的一份報告指出,在人工智能的分支深度學習方面,中國發表的相關期刊文章已然超越了美國。咨詢公司普華永道預測,在 2030 年之前,與人工智能相關的發展將會促使全球 GDP 增長16億美元;據估計,近一半的財源都將累積至中國。盡管美國在絕對數量上仍然領先,但近幾年來,中國研究人員所提交的人工智能相關的專利申請數量增加了近 200%(如下圖表所示)。
若要了解為何中國如此得天獨厚,便應當考慮人工智能所需的投入。中國擁有豐富的兩大基本要素——計算能力以及資本。從阿里巴巴與騰訊這樣的巨頭,到 CIB FinTech 與 UCloud 這樣的初創公司,這些中國企業都在加快速度建立數據中心。據咨詢公司 Gartner 報道,云計算市場近年來已增長了 30% 之多,且將持續增長下去。據智囊團烏鎮智庫統計,2012 - 2016 年,中國的人工智能企業獲得了 26 億美元資金,雖然低于美國同行的 179 億美元,但總體而言仍在飛速增長。
然而,能使中國真正成為人工智能「應許之地」的還有兩種資源。其一便是研究型人才。微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋( Harry Shum )表示,除了數學方面的強大才能,中國還有研究語言和翻譯的傳統。在阿里巴巴負責管理 150 位數據科學家的閔萬里說,在中國發現頂尖的人工智能專家要難于美國。但他預測,由于許多大學都推出了人工智能計劃,所以未來幾年將有所改變。據估計,中國擁有超過世界五分之二的高素質人工智能科學家。
其二是數據,即人工智能最為重要的部分。軟件和數字產品在過去大多都遵循代碼所制定的規則,因而擁有頂尖編程人員的國家便更具優勢。隨著深度學習算法的出現,這些規則愈發以從數據庫中提取出的模式為基礎??捎玫臄祿蕉啵軌驅W習的算法也會更多,人工智能產品也會因此而更加智能。
中國的人口等規模及數據多樣性為這一循環提供了有力的燃料。僅靠日常生活,全國近 1.4 億人口所產生的數據便多于其他幾個國家之和。即便是一些罕見病,也不曾缺乏用來教算法識別這種病的病例。由于打漢字比西方國家的文字更為費力,因此中國人往往比西方人更傾向于使用語音識別服務,于是公司便擁有更多語音片段來改進語音產品。
數據富礦
真正能夠使中國大放異彩的是,它擁有約 7.3 億的互聯網用戶,超過了其他任何國家。幾乎所有人都通過智能手機上網,而它們含有傳感器且方便攜帶,產生的數據遠比臺式電腦珍貴得多。例如,大型沿海城市的人們已不再使用現金進行小額購物,而是通過移動設備用支付寶和微信支付等完成交易。
中國人似乎并不十分重視隱私,這使數據更易于收集。例如,以迅雷不及掩耳之勢風靡大型城市的共享單車服務,不僅提供了實惠的交通工具,而且它還是一種「數據播放」。當乘客租用單車時,一些公司便可以通過車上的 GPS 裝置追蹤用戶的行動。
中國的年輕人似乎十分熱衷于以人工智能驅動的服務,對個人數據的使用也很放松。小冰是微軟開發的一個開朗樂觀的聊天機器人,如今她已擁有超過 1 億位中國用戶。他們通常會在夜晚 11 點至凌晨 3 點之間討論白天遇到的問題。她會從互動中學習,從而變得更加智能。小冰不再僅限于提供鼓勵或講笑話,而是創作了第一部人工智能創作詩集「陽光失了玻璃窗」,這引發了中國文學界對于是否存在人工智能詩的激烈討論。
在中國,人工智能的另一個重要支持者便是政府,這項技術在其目前的五年計劃中地位顯赫。技術公司正與政府機構進行密切合作,如百度已響應號召,領導國家深度學習實驗室。但政府用清規戒律對人工智能公司加壓的可能性微乎其微,中國包含個人資料保護相關規定的法律有 40 多條,但它們鮮少得以執行。
企業家正在利用中國的人才與數據優勢。許多人工智能公司僅建立兩年時間,但與西方的同行相比進展神速。李開復是 21 世紀初的谷歌中國區總裁,如今是風投基金創新工場的創始人,他解釋道:「中國的人工智能初創公司通常會更快地進行迭代與執行」。
于是,中國已然擁有了一批人工智能獨角獸,這些初創公司的價值超過了 10 億美元。位于北京的新聞聚合平臺今日頭條采用了機器學習,通過使用諸如讀者興趣及位置等信息來進行文章推薦;它還使用人工智能進行虛假信息過濾(在中國,主要是指可疑的醫療廣告)。而另一家初創公司 iFlytek 則開發了一個語音助手,它能將普通話翻譯為包括英語和德語在內的幾種語言,即便是發言者使用俚語,或是存在背景噪音可能夠正常工作。另外,曠視科技的人臉識別軟件 Face ++幾乎能夠立即識別人臉。
「天網」生活
在曠視的總部,參觀者往往像是在體驗一場技術示范。大廳的攝像機并不顯示 ID :員工進出不必出示徽章。整個辦公室的設備都是類似的,而反饋則顯示在視頻墻上。當墻上出現人臉時,會立即被一個白色矩形框起來,同時顯示這個人的相關信息。屏幕的右上角則鮮明地標示出「 Skynet 」,這是終結者系列電影中消滅人類的人工智能系統名稱。這家公司已經授權支付寶和叫車服務公司滴滴來檢查新客戶的身份——將他們的面部與政府的登記圖片作對比。
為應對這些初創公司的成功,中國的科技巨頭也開始大力投資人工智能。百度、阿里巴巴和騰訊(統稱為 BAT )正在開展許多相同服務,包括語言及人臉識別。但他們也試圖憑借自身優勢,在人工智能的特定領域占領主導地位。
迄今為止,騰訊保持著最低配置,幾個月前才建立人工智能實驗室。但它勢必在人工智能領域一鳴驚人:與另外兩家互聯網界巨頭相比,它擁有更多數據。其微信的通訊服務擁有近 10 億賬戶,并且它也是從付款、新聞到城市指南與法律幫助等數千服務的平臺。騰訊在游戲方面同樣是世界領先,其風靡一時的游戲,如英雄聯盟與部落沖突在全球擁有超過 1 億的玩家。
中國電子商務領域的巨頭阿里巴巴,憑借數十億美元的投入使其云服務業務在國內云計算領域做到排名第一。6 月,在上海舉行的一次會議中,阿里巴巴展示了一個名為「 ET 工業大腦」的人工智能服務,它能夠通過視頻識別來實時優化交通,比如利用路邊的攝像頭預測汽車的行為,進行交通信號燈的調控。阿里巴巴稱,這個系統已將其家鄉杭州的平均交通速度提升了 11%。該公司還計劃強化「 ET 醫療大腦」,它基于人工智能服務進行藥物發現及醫學影像的診斷,并已簽署 10 余家醫院來獲得所需數據。
但百度的命運與人工智能連接最為緊密,部分原因在于也許技術便是追上阿里巴巴和騰訊的最大機遇。它將大部分資源都投入到了自動駕駛領域,希望能在 2018 年之前使自動駕駛汽車上市,并在2020 年之前為全自動汽車提供技術支持。7 月 5 日,百度在北京的 AI 開發者大會上發布了第一版本的自駕車系統,稱為阿波羅。
阿波羅計劃不僅要實現汽車在街道上的安全航行,同時也是一個向外開放項目。谷歌子公司 Waymo 、電動汽車公司特斯拉等競爭對手正在小心翼翼地守著自己的軟件與收集的數據。而百度不僅計劃開源其系統平臺,而且還會進行數據共享。他們的想法是,使用百度技術的汽車制造商會做出同樣的舉動,從而為自動駕駛汽車的數據創造一個開放平臺,用陸奇的話來說,便是「創建自動駕駛汽車的 Android 系統」。
像北京人一樣開車
中國企業將人工智能產品推向海外能否成功還未可知,因為如今只有極少數公司這么做。它們理應發展很順利:那些在中國熙熙攘攘的街道上進行了大量訓練的自動駕駛汽車,在歐洲更為有序的交通道路上進行導航時理應該更不在話下;相反,在德國訓練的汽車可能連北京的第一個路口都不大可能通過。西方消費者在使用時仍有所猶豫,因為自動駕駛汽車是在對事故耐受度更高、寬松而又安全的環境中進行培訓。據稱,北京市政府正在千方百計使其能成為自動駕駛汽車的試驗城市。
還存在另一個風險。目前,數據是人工智能最珍貴的輸入,但其重要性可能會降低。人工智能公司已經開始使用包括來自視頻游戲的模擬數據,新型的算法則可能得以通過更少樣本來實現同樣的智能化效果。馭勢科技是一家正在開發自動駕駛技術的北京初創公司,其首席執行官吳甘沙警告稱:「其中的危機在于我們滿足于數據上的優勢從而停止了算法創新」。盡管目前為止,中國還正處于剛剛起步階段,但在人工智能領先地位的角逐中,它在步步逼近美國。
本文由轉自機器之能(微信公眾號:almosthuman2017)。