天云大數據CEO雷濤:2016是大數據的“寒冬”,AI產業化的春天
隨著互聯網和大數據技術的高速發展,面向特定領域的人工智能技術已經取得突破性進展,谷歌、微軟、百度等巨頭積極的在人工智能領域多點布局、搶占產業機遇,這一切都預示著:AI行業已經成為新風口,產業化進程成為必然趨勢。
本文為數據猿年關策劃活動《大數據的2016,我的2016》系列稿件,感謝本文作者 天云大數據CEO 雷濤 先生的投稿(數據猿專訪雷濤)。
敬請期待春節后的2月16日,由數據猿與中歐商學院、騰訊視頻共同舉辦的高端***線下演講欄目中歐微論壇之《超聲波》。
2016年,Gartner發布的新興技術成熟度曲線上,大數據赫然在曲線上消失,然而,就在三年前,大數據還處在成熟度曲線的頂峰,2014年開始走下坡路,2015年已經脫離曲線。
2016年,大數據已如空氣般融入我們的生活,然而實際上,大數據的技術流行性高,而實際的價值還未真正體現,商業形態尚未成熟,當建設大數據的虛火熱潮退卻,需要通過真實的應用價值來回報。大數據寒冬正是市場機制自動產生優勝劣汰的過程,這是歷史規律。
在人工智能領域,根據艾瑞數據預計,2020年全球AI市場規模將達1190億元,年復合增速約19.7%;同期,中國AI市場規模將達91億元,年復合增速超50%。AI產業的市場空間可謂是極為廣闊。
舉例來說,Google公司正致力于無人車項目、IBM已攜手Apple聯合開發健康大數據人工智能平臺、Facebook正測試名為“M ”的人工智能助手服務;而國內,百度已將人工智能當做自身發展的先鋒力量,樂視推出了超級大腦,獵豹投入5000萬美元研發機器人...眾多互聯網巨頭都在擴張對AI產業的人才、資金投入,加速對AI領域的產業布局。
隨著互聯網和大數據技術的高速發展,面向特定領域的人工智能技術已經取得突破性進展,谷歌、微軟、百度等巨頭積極的在人工智能領域多點布局、搶占產業機遇,而其他以人工智能運算和應用為產品的初創公司也紛紛出現并發展。
這一切無疑都在預示著:AI行業已經成為新風口,產業化進程成為必然趨勢。
行業被顛覆,大公司會垮掉。這并非聳人聽聞,根據巴步森商學院的調查,今天在《財富》世界500強榜單上40%的公司都會在10年內銷聲匿跡。
10年之內,大數據與人工智能將會幾乎改變每一個行業。
Welcome to MI Era——在這充斥著無數新銳的指數型組織與未來的百億獨角獸的摩登機器時代,人類該如何自處?又該如何與機器共生?
具體來說,AI的自學習能力,已經超過了人類對其程序化約束,如何與AI共生共演進,必須認知Machine Intelligent,了解機器如何思考和行動。
一、從BI到AI,人類從數據操作工到設計師的晉升
首先從幾個問題出發切入這個話題: 經典的大數據故事啤酒與尿布到底回答了我們什么?抽象的事實是否只“印證”了我們主觀假設思維?數據面向人還是終將面向機器?人與數據之間的角色發生著什么樣的變化。
當下,企業對于大數據技術的應用已經不再局限于BI,AI在商業實踐中的價值日益凸顯。而AI和BI的***區別在于,是誰在做決策。經過BI分析,***還是把數據交給人去做決策和判斷,這個過程并沒有形成閉環,同時周期和反饋延時也比較長。而AI的分析過程是層層嵌套的,每一個節點的數據都會作為下一個數據輸入輸出的依據,是一個閉環的過程。
BI就像是流水線的工人在一條生產線上重復擰螺絲的過程,其他環節是不理會的。而AI需要一個體系化的思路,需要人從生產線上退下來,設計整個流程模型并通過自動化的方式運行。在這個過程中,人是流水線的設計者,而AI的落地則是一個自動化、自我循環的供給過程。
其中,最難的環節在于如何定義問題,而不在解決問題。也就是說,這些大量的計算模型如何設計,是需要結合企業具體的業務經驗才能有效落到實處的。
二、AI,還原世界的復雜性
人類習慣于抽象和簡化思維,人工智能依靠質樸的數學和超強的計算能力,還原了世界的復雜性,AlphaGO幫我們定義了什么是大局觀和棋風,深度學習的特征建立過程,就是協助我們對復雜問題描述的精確量化。笛卡爾為之后的牛頓準備了一個坐標系,使F=ma的推演成為經典。在步入MI機器智能時代的前夜,熟悉了解機器思考的方式,是人類能夠生存并與之共同演進協同的基礎。
三、AI的兩面:人類保護自己的矛與盾
大數據時代,我們最擔心和顧忌的就是自己的隱私。然而,人工智能不僅接觸個體數據,也同樣保護個體隱私。真正去使用大數據手段和技術的時候,是不會存在隱私問題的。
當我們只有一把鑰匙對著一把鎖的時候,當然會擔心小偷把鑰匙偷走。但是,如果我們門口放著一百萬把鑰匙呢?只有機器能對上!過載的信息會使得單獨個體的信息被漠視,因為它的計算成本很高。
特別是在AI模式下,計算的過程已經通過AI模型設計好了,這是一個數學計算的過程,比如Apple公司使用差分隱私技術(Differential Privacy),能夠把物理世界的你和虛擬世界的你隔離開來,開發者使用個體數據時,也不會有隱私泄露的問題了。
對抗生成網絡(GAN),MI世界的羅馬競技場,人類如何操控兩個AI怪獸互博,競爭中獲得智力迭代。例:視覺計算的看圖識字與預測
四、AI民主化(AI Democracy)
人類使用火拓展體能,使用指南針拓展認知,AI的應用將是人類整體的智力提升。它必然是集體性的,而非少數利益集團所獨占。但高深的數據科學,昂貴的計算資源和數據資源,三重障礙讓AI依然是陽春白雪。如何讓AlphaGO 的預測能力,像買書一樣便捷便宜,推動了AI民主化。
得益于科技的變革,AI正式告別陽春白雪的年代,日益走向普及化、民主化,使得AI成為企業數字化轉型的必備路徑。在輕AI理念的普及之下,國內高科技企業正致力于對Alphago背后高深莫測的數據科學進行封裝,增強其友好易用性,從而推動AI在企業的大規模應用。
Android/IOS平臺化,屏蔽了技術復雜度,推動了移動互聯網的繁榮。AI平臺的興起,將釋放巨大AI潛能和催生更廣闊人工智能市場。例:Google Tensorflow, Facebook FBLearner, MS CNTK,騰訊Angle, MaximAl.
Facebook、谷歌、亞馬遜、微軟和百度都在AI領域注入重資。機器學習迅速變成最火的人工智能形式,隨著計算機系統越來越大、越來越復雜,很明顯的是:它已不足以支撐計算機如何詮釋數據的硬編規則(hard-code rules)。教計算機如何詮釋自己的數據,要更加容易得多。
讓人類失業、AI詮釋自身,令人不免想起科幻電影“黑客帝國”的故事,關于機器與人類的最終命運的想象與討論永遠生生不息。
關于作者
雷濤,現任天云大數據***執行官,長江商學院特聘講師,博士后工作站企業導師,擁有20余年北美信息科技公司從業經驗。
2002年在Sun Microsystem晉級亞太區唯一的ES Ambassador企業方案大使;
2005年入席SNIA存儲工業協會中國區技術委員會聯合主席;
2013年首批CCF中國計算機學會大數據專委會委員。