八部電影幫你看懂大數據
如果你是位數據分析行業的專家,你肯定以為我們會提到《點球成金》(Money Ball),很遺憾以下將要介紹的電影貌似與大數據無關,但能幫助我們從八個不同角度解讀大數據的未來,以及,作為IT經理的我們的未來。
一、《V客帝國》
(V for Vendetta 2005-James McTeigue)
在大數據的世界里,V并非指“仇殺”(Vendetta),而是著名的3V定律:
Velocity速度——以接近實時的速度處理數據產生報告,而不是像過去那樣漫長的休假結束后才能看到報告。
Volume容量——在不斷膨脹的海量數據中依然能發現有價值的信息。
Variety多樣性——能處理各種數據源(結構化、半結構化、非結構化數據)
二、《速度與激情》
(Fast and the Furious 2001-Rob Cohen)
在未來數據驅動的企業中,任何一項業務計劃能否成功都需要依賴飛速的大數據分析,企業間比拼的是大數據跑車的極速性能,如果你能比競爭對手更快了解一個業務計劃的可行性并快速決策,你的將成為快公司,而那些不夠Fast的CIO們,迎來的將是老板的Furious。
三、《淘金記》
(The Gold Rush 1925-Charles Chaplin)
你也許不止一次在討論會上聽說:數據將是未來世界經濟的“原油”。大數據是個大金礦,但是對于大多數企業來說,通往大數據致富的道路鋪滿荊棘而不是鮮花。最大的障礙不是技術,而是來自企業向數據驅動型企業文化的痛苦轉型,其艱難程度堪比卓別林在阿拉斯加啃鞋底。
四、《飛屋環游記》
(Up 2009)
Pixar出品的最感人的電影非《飛屋環游記》莫屬。影片為我們展示了在云端漫游的浪漫和快樂。是的,彈性云基礎設施能很好地應對大數據的規模增長。如果你過于關注大數據硬件的可擴展性,那么說明你還停留在解決技術支撐層面的事情,而不是大數據的商業價值。Amazon和Joyent這樣的彈性云服務商能幫企業忘掉大數據的技術性問題。
五、《象人》
(The elephant Man 1980)
大數據世界也有一頭風騷無比的黃色大象——Hadoop,曾經是Google的一個項目,開源后成為大數據基礎設施的基石。Hadoop還提供一系列相關配套工具,將Hadoop的潛能發揮到極致,例如Ahache Mahout——機器學習,和Apache Hive——在Hadoop之上搭建數據倉庫,并與MongoDB等NoSQL數據庫形成天作之合。
六、《泰坦尼克號》
(Titanic 1997)
沒有對隱藏的未知因素進行建模和分析就做出的決策將可能是災難性的。大數據給你看得見的信息,同時還能從數據中發現你看不見的東西。分析海量數據之間的“模式”、“關聯”..你會發現很多水面下的信息內幕。例如,汽車顏色與保險費用之間的關系。大數據時代之前,大多數的企業管理都盲人騎瞎馬,或者像泰坦尼克號那樣黑夜中在冰山中穿行。
七、《少數派報告》
(Minority Report 2002)
《少數派報告》中,阿湯哥工作的犯罪預防部門采用的基本是預測型分析技術,這也是大數據的殺手應用,未來的優秀企業領導者無需借助管理藝術、或者類似瑪雅巫師的管理哲學,機器學習和數據挖掘技術將成為管理者的數字水晶球。
八、《老無所依》
(No country old men 2007 )
這個故事有點殘酷,但事實就是如此,大數據需要全新的技能組合,在大數據面前甚至80后都不再年輕。老一輩數據庫專家們需要洗心革面,全身換血,掌握最新的數據存儲和處理技術。此外,大數據的“多樣性”還意味著大量數據將來自互聯網的API或SPARQL等端點,利用這些數據你還需要掌握Python、PHP、Java等技術。