2018,人工智能可以在哪些領域最快得到應用和普及?
根據騰訊互娛發布的《2017 Q3 AI 行業全景熱度觀察》,2017年第三季度,全球AI公司融資總額高達 77.42 億美元,僅比前兩個季度之和低10億美元,而與2012年同期相比則增長了70余倍。
雖然第四季度還沒結束,但10月底曠視科技4.6億美元的C輪融資額已經刷新了此前由商湯科技所保持的4.1 億美元的融資記錄,也成為全球人工智能企業迄今為止所獲得的***一筆融資。不難看出,火遍整個2017年的人工智能,到了年末依舊是勢頭不減,甚至很可能再次打破之前的各項融資記錄。
回顧過去,從1956年的達特茅斯會議到今天,人工智能已經走過了60多年的歷史。在這60多年中,人工智能經歷過高峰,也曾跌落到低谷,但從來沒有哪一次像今天這樣,成為街頭巷尾無人不談的話題。雖然這一定程度上得益于移動互聯網時代信息傳播效率的飛速提升使得熱點話題的影響力得以成千上萬倍的擴大。但另一個更重要的原因是,這一次的人工智能復興與以往的***區別在于,它讓人們真正看到了 AI 技術改變人類未來生活方式的可能性。
用李開復的話說:“今天的人工智能是‘有用’的人工智能……這一次人工智能復興的***特點,就是 AI 在多個相關領域表現出可以被普通人認可的性能或效率,并因此被成熟的商業模式接受,開始在產業界發揮出真正的價值......我們說‘人工智能來了’,其實是說,人工智能或深度學習真的可以解決實際問題了。”
可以和李開復這段話相互映證的是,在上周阿里云主辦的2017云棲大會·北京峰會上,阿里巴巴明確表示人工智能不應僅僅是“概念上的 AI”,更是“產業上的 AI”,同時宣布了阿里云人工智能技術在金融、零售、航空、交通等多個行業的實踐成果。
越來越多的跡象表明,今天的人工智能,真的和以往大不一樣。
在過去這一年中,無論是互聯網公司還是傳統企業,無論是在公司內部宣講戰略還是在外部會議上發表報告,都是三句話不離 AI,唯恐自己被拋棄于時代潮流之后。但與之前的幾次技術浪潮相比,人工智能對人才和資源的要求顯然要高出不少,不是誰都能玩得轉的。
那么,對于大多數公司來說,進入人工智能領域有哪些難以跨越的門檻?企業如何利用 AI 技術助力現有業務更上一層樓?還有,在未來的幾年里,人工智能在哪些產業領域可以最快得到應用和普及?
近日,IBM 全球杰出工程師、IBM 研究院認知系統全球研究負責人林詠華女士接受了“AI時代的移動技術革新”大會主辦方的采訪(大會將于2018年1月5日在北京國際會議中心舉行,林詠華女士是受邀演講嘉賓之一。),聊了聊她對上述問題的看法。以下內容根據采訪記錄整理而成。
IBM 林詠華
QA:如何看待當下的人工智能熱潮?有多少是理性驅使,又有多少是人云亦云?
人工智能目前無論在企業還是投資界都是被火爆地追逐著。說實在話,當IBM在 2011年構建出 Watson,并***在智力競賽中打敗***秀的人類選手時,能預見人工智能對未來業界發展的重要性,但沒有想象到這種人人談人工智能的火爆局面。
縱觀整個信息技術在過去10年的發展,無論是10年前移動通信的發展熱潮,還是5年前云計算的風起云涌,都沒有今天人工智能被關注的廣泛性和火爆性。原因是什么呢?是今天人工智能的可實驗性遠遠高于之前的信息科技。
這個“可實驗性”是指一個開發者、一個大學生,甚至會編程的中學生都可以進行人工智能實驗性的嘗試。它來源于整個開源社區在代碼和數據上的整體貢獻, 得益于整個信息科技領域對開源文化的推動,也得益于幾個大的人工智能會議對被錄用文章的數據和代碼的公開性要求。
在過去幾年,圍繞深度學習、神經網絡等算法的代碼以及公開數據集層出不窮。一個開發者,只需要懂 Python,就可以在一天之內構建起一個開發環境,并把開源的代碼跑起來。利用開源的數據集,就可以重現別人的結果。
一個新的人工智能研究方向出現,就伴隨著一些優秀的數據集公開。例如,當年李飛飛主導的 ImageNet 為今天的圖象識別奠定了***的數據集基礎,今年12月 MIT IBM Watson Lab 為了推動視頻中的動作識別,共同推出的百萬量級的視頻動作數據集。所有的這些貢獻,都是為了降低大家實驗的難度,推動業界更快速地解決人工智能中的難題。在這種人人都可以嘗試的氛圍下,既推高了大家對這個領域的關注和興趣,必然也帶來了人云亦云的火爆。
但是,這是否就代表了今天在學術界解決了的問題,相關的技術已經可以大量地使用到工業界呢?我覺得大家需要看到工業界和學術界之間的差距。之前我也看到一些人工智能領域的專家進行了許多分析,我這里就討論兩點:
● ***是數據的差異。
數據是人工智能必不可少的用于訓練機器的輸入。而今天能在公開途徑獲得的數據集絕大多數都是非商業用途數據,大多數都是從互聯網上積累的數據。真正用于工業場景的高價值數據是難以放到公開數據集中,也難以讓千千萬萬研究者進行算法研究的。
IBM 研究院在醫療、汽車駕駛、生產制造等重要行業領域與相關企業進行人工智能合作研究。在這些行業和企業中,我們遇到了大量公開數據集所沒有的數據分布。在面對行業生產部署的嚴苛要求時,我們一些已有的研究是不適用的,許多在***會議中號稱的***結果也是不適用的。因此,這里需要我們腳踏實地,深入工業行業進行人工智能的研究和開發。
● 第二是人工智能系統本身的成本。
把人工智能用到工業界,我們需要認真審視它附加到現有產品上的成本開銷。以視頻監控為例,在視頻監控中使用人工智能是一個很熱的話題。今天,使用人臉識別、人或車輛的自動捕捉進行初步的視頻分析已經開始廣泛使用在城市、公共安全等領域。
其實基于計算機視覺的人工智能可以做得更多,它可以檢測和識別各種物體(而不僅僅是人或車輛),檢測人的各種動作等等。但基于深度學習的目標檢測算法往往需要大量的GPU計算資源。基于今年***的GPU硬件能力,一塊高性能的GPU也就只能支持3~4路視頻的復雜目標檢測(單個模型)。平攤到每路視頻,就要大約1000~2000美金的硬件成本。相比起目前4K攝像頭的成本,將近是10倍的成本差異。
如果我們進一步考慮動作檢測,使用光流計算或3D深度學習或者更復雜的算法,這個成本的疊加更加難以接受。所以,在人工智能向前行進時,我們需要更多的研究和創新,去解決全系統的優化問題,而絕對不能只停留在單一的功能或精準度的層面。
QA:對于在 AI 領域技術基礎比較薄弱的企業,如何才能享受到 AI 帶來的紅利?
為什么今天的企業都爭先恐后的想要進入 AI 領域?他們是希望成為像 IBM、Google 這樣的 AI 公司,每年到 AAAI 或 NIPS 發幾篇文章嗎?答案當然不是。企業想進入 AI 領域,還是希望在自己的業務領域能獲得新的增長點,希望借用 AI 的力量能打造出新的產品贏得更多市場份額,希望通過 AI 能把已有的產品提升一個水平從而更快地擊敗市場上的競爭對手。所以,對于這些希望利用 AI 技術的企業而言有兩點是重要的。***,找準 AI 技術在自身業務領域的定位,也就是未來產品的戰略思考。這一點是無論如何不能由別的公司代替你去思考的,因為只有企業自己最了解自身的業務領域、發展機遇和企業現狀。第二,Time-to Market,時間是十分寶貴的。在目前信息平坦的年代,市場機遇的賽跑就是時間的賽跑。
所以,對于各個行業的企業,如果希望享受到人工智能帶來的紅利,需要自身花更多時間去思考和策劃上面提到的***點問題(產品戰略),而在第二點(Time-to Market)上,需要懂得借助外力。今天,在與時間賽跑的過程中,企業面臨的***挑戰是人才和數據的問題。如何“借助外力”,往往也是企業猶豫的。如果像傳統的購買企業服務模式來解決人才問題,對于一些行業會行不通。對于許多行業,他們的數據是具有高度保密的性質,不能把這些數據都交由第三方公司進行數據訓練和分析。此外,企業的生產環境所針對的數據類型也會隨著時間有所改變,例如零售業中貨架的商品品類,生產線上產品的批次改變等。因此,哪怕企業交由第三方公司開發了一個機器學習的模型,是否之后所有在生產環境中的變化都要依賴第三方公司進行調整呢?所以,在引入 AI 技術的過程中,企業往往會在“人才培養時間過長”和“把控產品”之間猶豫。正因為看到這種現狀,IBM 在為企業市場打造的 AI 平臺中引入了 “AI for AI”的概念。我們為企業打造的 AI 開發平臺不僅僅是一套工具或方法論,而是真正把一個“AI大腦”潛入到 AI 開發平臺。我們在“AI大腦”中率先引入了多種深度學習的技術,如遷移學習、自動化機器學習(auto machine learning)、數據增強(data augmentation)等。一方面我們把 IBM 研究院多年的機器學習研究成果內嵌到系統中,讓 AI 開發平臺更像一個專家系統;另一方面,我們通過AI for AI的技術,讓這樣的平臺可以針對企業自己的數據進行自動化學習和優化。通過這些技術的內嵌,我們希望企業開發團隊在沒有深度學習的技術背景下,也能很容易地獲得好的機器學習準確率。通過“AI for AI”的開發平臺,我們希望幫助企業自身擁有 AI 的大腦,應用開發團隊很快就能上手,使用企業自己的數據去進行機器學習以及AI 產品的研發。
在人才的問題之后,另一個困擾企業的問題是數據的問題。過去幾年,深度學習的成功是基于海量的互聯網開源數據。但這些數據都是互聯網的數據,和企業希望解決的問題(如特定病種的醫療影像、產品質量的影像等等)沒有直接的關系。所以,當需要使用 AI 技術來賦能自己的業務領域時,企業需要自己準備業務場景的數據集,也需要由具備專業領域知識的人員來標注數據集。因此,準備數據這個過程本身就極耗時間和人力。另外,企業往往會面臨數據不足的問題,尤其是需要高度關注的數據類型。例如,在醫療影像中,往往有著各種癥狀的數據比健康人群的數據更為重要;在生產制造中,有著各種瑕疵問題的數據比質量正常的產品數據更需要關注;在汽車駕駛中,在各種惡劣天氣路況下的數據比正常天氣和光照的時候獲得的數據更需要我們注意。但這些數據往往是小概率情況下的數據。因此,如何針對這些數量***卻又十分重要的數據進行機器學習呢?不解決好這個問題,就難以把 AI 真正用到工業界場景。意識到這個問題的重要性,IBM 研究院確立了一系列針對小數據(Small Dataset)的研究,基于遷移學習、數據增強等課題進行深入研發。這些技術也應用到了 IBM 的 Watson 及企業 AI 開發平臺(PowerAI)之上,直接幫助企業解決數據的問題。
QA:未來幾年內,哪些 AI 應用可以大規模投入市場?哪些還需要更長時間的研究及驗證?
由于業界的你追我趕,AI 儼然是在一個高速跑道上發展。大家對短期的定義是1~2年,中長期是3~5年。一個新的 AI 技術是否可以大規模投入市場,應該看這個市場對該技術的差錯容忍程度的高或低,例如,該技術能有 80% 的準確度就可以被接受,還是需要有 95%,甚至 99% 的準確度才可以?
記得在 2015 年,一個玩具廠商推出了 CogniToys(一個能跟孩子對話的綠色小恐龍),當年還被評為“2015 年度***玩具”。其實當年 CogniToys 的對話能力比今天國內好些公司推出的智能音箱要差好些。但因為 CogniToys 只是一個玩具產品,它不需要有很高的準確度。跟孩子的對話對一句錯一句也沒有多大關系。所以在 2015 年,哪怕機器對話技術還不成熟,也不能阻擋 CogniToys 在亞馬遜上熱賣。但是,同樣的對話技術,如果我們用于要求嚴謹的醫療行業,或銀行理財行業,就需要有更長的技術成熟期。
又例如,有一些技術今天可能只做到 90% 的準確率,如果我們希望在未來 1~2 年能廣泛使用,就需要從應用場景上進行折中。折中的手法可以是多樣的,例如加入人為判定。我們在 top1 的準確率不夠的情形下,可以提供給用戶 top5 的識別結果,讓用戶再從 top5 人為判斷。通過這樣的手法,可以讓某些 AI 技術加快在一些領域的使用。當然,可以使用這樣折中手法的應用領域,必須不是工業控制領域的。對于需要實時控制的系統領域,包括無人駕駛、自動化控制等,都必須有完全高準確率的要求。而這種對高準確率有完全硬性要求的應用場景,必然需要更長時間的研究和驗證。
哪怕同一個技術,同一個工業領域,放在不同的地區使用,也會有時間的先后問題。例如,使用 AI 技術進行無人駕駛,目前多個廠商都先挑選諸如特定場區工程車輛、園區班車等,因為路況相對單一和簡單。我們最近到印度參展,看到印度的汽車行業,就連輔助駕駛的研發,也都才剛剛開始。重要原因就是該地區的路況復雜度遠高于美國和中國。所以,無人駕駛如果要在印度落地,或許需要 3~5 年的時間。
2018年1月5日“AI時代的移動技術革新”大會將在北京國際會議中心舉行,感興趣的伙伴可以點擊鏈接http://www.huodongxing.com/event/4411209831800?qd=wemedia索取大會門票。