王煜全和他的數據夢想:大數據的理性力量
2012年的中國電影市場,《泰囧》無疑成了最大黑馬,然而幾家歡笑幾家愁,之前熱炒的《1942》成了電影市場最落寞的看客。和上映之前很多影視專家人看好《1942》不同,當時一家新成立不久的通過社交媒體數據預測電影票房的網站最早做了票房預測分析,這家數據預測公司得出的結論是,《1942》票房不會超過4億,想要掙錢估計很懸。
后來現實證明了一切,數據不會撒謊,那些埋藏在社交媒體中,零散的非結構化數據像巨大的寶藏,就看你有什么工具將其挖掘出來。而這家初創公司,正是海銀資本的創始合伙人王煜全全力投資的基于社交媒體領域大數據分析的公司之一。
王煜全,Frost & Sullivan首席顧問,海銀資創始合伙伙人。海銀資本是與門孵化和投資社交網絡應用企業的機構,已經孵化了超過15家社交網絡企業,積極推進社交媒體和大數據相關的科學研究和應用研發。他是一個堅定相信數據和理性力量的人。
《大數據中國》近期對王煜全進行了專訪,探求大數據遇上社交媒體所帶來的巨大魅力和大數據背后究竟隱藏著多大的能量。
新瓶老酒,大數據一直存在
大數據之所以能火,因為大數據有實在的商業價值,并和技術不斷的發展有關,原因有幾點:過去也存在著龐大的數據,但卻是有需求而沒有數據來源,無法滿足企業的需求。目前,通過現在的技術手段,可以獲得這些數據,所以大數據是應運而生。尤其是智能手機的快速發展,通過終端,數據可以有效積累起來;再加上云計算技術的發展,云平臺的支撐讓大數據能夠在上面進行更好的運行。
大數據就是讓孤立的數據形成新的聯系
現在社交關系網絡的出現使得我們可以通過一個人看出更多其它人的關系。如果要對一個人進行分析,就要對其歷史情況作出分析并延伸,比如,一個人做過的偶然性事件,以前做預測不敢延伸,只會預測他未來一定會做以前不斷重復做的事,把偶然性完全排除,這樣的預測結果是收斂的。但是有了社會化數據,每個人的數據都存在整體的數據池里。以前理解數據時是孤立的,你的行為和我的行為沒有關系;但數據池里大數據是不能孤立理解的,你以前的數據,只能用來預測你,不能拿來預測我。但是現在基于社交關系,就變成了1度關系,即你的數據可以拿來預測我。大數據的整體理念是整體看問題的理念,就等于是從上帝視角看到所有問題,然后再來看某一個點。這種時候,這個點就在周圍環境里。
社交媒體讓數據產生關系,從而產生更大價值
大數據,實質上就是從最簡單的理念去考慮問題。但從大數據疊加帶來的加成效應來看,則完全是突破性的。創新點就在于,以前的數據積累是零散性,現在的數據積累為系統性,能夠讓我們從更加全局的角度去思考問題,考慮時間因素、人際影響的因素、潮流趨勢的因素,考慮更多現實的因素。
谷歌做安卓是最典型的例子。谷歌要把包括在國外事務相關的業務在內的社交數據做起來。如果是孤立的數據,那你收的是一堆計算機信息,計算機和計算機雖然也有聯系,但是不能代表太多東西,這是物理連接,而人和人的聯系則意味著很多信息,彼此之間能相互影響。因此,谷歌把Facebook當成最大的競爭對手,谷歌的數據量可能比facebook還多,但數據的含金量卻沒facebook高。facebook是一張基于社交關系的網絡,它把一個無序數據變成有序數據。
現代交通危險系數高,但是我們不可能再回到馬車時代
數據采集不是完全沒有規則,現在都在積累規則。新浪微博是一個特例,它本來是個開放數據,用戶微博上的資料是公開性的,對于這種開放數據的獲取是不受限制的。未來獲取的規則會慢慢規范?,F在政府開始做數據采集方面的規范,用戶或者企業能獲取多少數據,不再是平臺自己說了算。未來到底能取多少數據,哪些是該取哪些是不該取,哪些會受約束?一方面行業會逐漸的規范起來,另一方面監管機構也會完善起來。新興行業都是這樣,剛開始的時候會亂,慢慢大家把規則摸清楚了,那監管就起來了。
大數據是一個發展趨勢,雖然會遇到各種問題,但是趨勢不可逆轉,就像現代交通工具有弊端,但是大家不會回到馬車時代。所以大數據也如此,即使有弊端隱患存在,但是也無法把它廢掉。
大數據會加強我們對未知的探索
基于大數據的分析,會帶來更多的預測。但是大數據實際上最能預測的是人類機械的部分,就像你今天幾點起床,明天幾點起床。大數據沒有創意,人們會越來越重視數據的力量,但是多樣性依然存在,創造力才是人類最偉大的價值。大數據基于規則做預測,大數據不能沒規則做預測。實際上,恰恰是因為大數據把基于規則的事情都干了,才能讓我們有更多的時間探討不規則。
“如果大數據能預測我的行車路線有什么不好的,那么這樣我就可以不考慮開車的問題,我就考慮創造性的事了,所以這會煥發我們的活力,會加強我們對未知的探索,因為我們有時間去探索了。”王煜全舉例說。
學會利用數據,才有更好的未來
由于信息不透明的緣故, 以前的商業靠價格競爭,不過這在大數據時代沒戲,以后競爭要靠服務的競爭,靠個性化競爭。服務個性化基于對大數據的理解,從別人的行為數據要分析出他的行為特征、需求,然后做個性化提供,這個時代變成了擁有算法優勢的人具備更多發展機會。“大數據的金礦就在這兒,看你會不會挖,會不會煉。”
人亦是如此,要學會利用大數據?,F在很多爭論挺有意思,如,微博微信來了,把大家弄的都很煩,信息突然從不足到突然過剩,而且謠言滿天飛。很多人就說過去那個時代多好啊,一聊就是《人民日報》,但是那個時代回不去了,所以你只有適應大數據時代。 實際上,未來人們對幸福的需求是一樣的,但未來的成功跟我們不一樣。在過去你能成功,在未來未必能成功,這個時候我們要面向未來去思考。在大數據時代,會解讀數據,會理性思考,會利用工具,你就會優秀。
大數據是無形的寶藏,但不是哪都有金子
如果是純粹技術的大數據,意義不大,我更看重大數據的商業價值。如理論上氣象也是大數據,但我們沒有興趣,因為我們還是要實用,要改變世界,并去提供服務。我們要思考大數據到底能干什么,能解決那些現實生活中的問題。
挖土機都一樣,你挖出沙子,他挖出金子,那就不一樣了。能看出地下有沙子還是金子,這就是區別。國內有些搞技術研究的不問青紅皂白,挖了再說,這是中國人不好的地方。國外的研究方式是先看哪兒可能有金子,所以你看尼古拉斯·克里斯塔吉斯(《大鏈接》一書作者,本書2013年已由中國人民大學出版社推出)琢磨一件事,他看到了基于強關系的一些現象,比如老兩口老是一個去世,另一個就活的不久,他發現這個有意思,有價值,要去研究,他就會發現金子。哪兒可能有金子,要求我們對礦脈敏感,但在目前中國環境下我們對礦脈不敏感。