莫輕言已成功部署大數據,也許你離達標還相去甚遠!
在大數據范疇大展拳腳肯定是個正確方向,同時世界各地的初創(chuàng)公司及企業(yè)巨頭也在借力大數據和大數據應用創(chuàng)造價值——將大量的數據處理轉化為金錢或競爭優(yōu)勢。然而光彩的背后,總是掩飾著一些不可忽視的真相。簡而言之,不是所有在大數據上的嘗試都得到了應有的回報,而且遠非如此。同樣這里也有另一個不容忽視的真相,在IT企業(yè)界,大數據“成功”定義的標準非常寬松,甚至“我們并沒有完全失敗”這種的觀念都可以歸結于“成功”。

那么大數據應用成功的標準究竟是什么?10gen戰(zhàn)略副總裁Matt Asay帶來了他為成功總結的4個標準:
首先,必須要可以運作
大數據應該為行業(yè)創(chuàng)造切實的價值,不止是高科技。McKinsey在關于大數據未來的報告中指出,大數據在醫(yī)療、政府、零售以及制造產業(yè)上擁有萬億的潛在價值。機構對大數據的成功實現需要在一下幾個方面帶來切實的收獲:附加收益、提升客戶滿意度、削減成本等。
其次,必須有本質提高
大數據交付的不應該只是漸進式的商務模式改善,更應該是本質上的突破。比如就初創(chuàng)企業(yè)Foursquare來說,為了發(fā)現數據之間的關系,Foursquare使用了機器學習算法讓系統可以建立“Explore”,一個社交推薦系統可以實時的給用戶推薦有價值的位置信息,使用新的業(yè)務模式去驅動位置信息類型業(yè)務。“Explore”依賴大數據技術,同時從多于3000萬個位置信息中獲取見解?,F在Foursquare已經具備了理解人們之間如何進行互動的能力,并且位置信息也不只止步平臺,而是真實世界。
再次,必須具備高速度
傳統數據庫技術會拉低大數據的性能,同樣也是非常繁瑣的,因為不管這項技術是否迎合你的需求,專利許可涉及到的企業(yè)繁瑣制度遠超出你的想象。一個成功大數據項目,使用的工具集和數據庫技術必須同時滿足數據體積及多樣性的雙重需求。論據是:一個Hadoop集群只需幾個小時就可以搭建,搭建完成后就可以提供快速的數據分析。事實上大部分的大數據技術都是開源的,這就意味著你可以根據你的需求添加支持和服務,同時許可不再是快速部署的阻礙之一。
最后,必須能以前所不能
在大數據出現之前,類似Gilt Groupe這種“限時搶購”公司根本不可能實現。限時搶購網站需要日處理上千萬用戶的登陸,并且會造成非常高的服務器負載峰值——通過高性能、快速擴展的大數據技術讓這種商業(yè)模型成為可能。
總結
大數據部署成敗的關鍵不是系統每秒可以處理多少數據量,而是使用大數據后給公司業(yè)務帶來了多少價值以及是否讓業(yè)務有突破性的提升。專注業(yè)務類型,選擇適合公司業(yè)務的工具集才是該重點關注的領域。