大數據產業投資:1美元只賺50美分
調查結果顯示,大數據最近的市場表現令人大跌眼鏡。部分由于媒體炒作的影響,許多企業都并未實際了解大數據產業價值時就對其進行了投資。之后,預料之中,一份新的分析報告顯示眾企業從大數據上得到的回報比他們預期的少得多,甚至少于他們的投資額。
少到什么程度呢?根據Wikibon的初步研究結果來看,答案是少得令人吃驚。
果然,Wikibon發現46%的大數據投資者僅從他們的項目中竭力維持了部分的成功,而2%的投資者不得不取消他們的投資并以完全失敗告終。
不過這并不代表大數據最終會不可避免地以失敗收場。
Wikibon指出,大數據投資的失敗原因之一是“許多企業投資像Hadoop這樣的大數據科技卻沒有與這個項目相聯系的精確可測量的商務應用。”他們僅僅是聽到“大數據”的名字就紛紛往里砸錢,卻沒想過他們真正期望達到的目標是什么。這與高德納的分析結果是相一致的。
對于大多數企業來說,大數據就等于Hadoop,而Hadoop的大意被IT人員解釋為“一個無人管理的數據垃圾堆。”而Criteo公司的工程副總裁朱麗恩·西蒙(Julien Simon)稱“大數據經常就僅僅代表著無用的數據。”
如果不知道數據的用途就貯存它,那么這些數據就只會增加噪音和掩蓋信號。著名統計學家內特·斯爾文(Nate Silver)假設道:
如果信息的數量增加至每天2.5*1^18字節,那么有用信息的數量幾乎為零。這些數據大多只是噪音,而噪音數量比信號數量增加得快。有太多假設需要被測試,總數據增加得太多了,但客觀實在的數據量是相對穩定不變的。
換句話說,增加更多數據,并不是大數據問題的解決方法,卻通常是問題的起因,而這也是許多公司從大數據投資中得到回報非常少的原因。
Wikibon的研究表明,最好的大數據項目“并沒有被引入IT界,而是為企業運營部門所用,它們通常被用于市場營銷,或用于小型但有策略的案例中。”這些企業會挖掘大數據內行專家,并對他們能用這項技術達到的效果報以切實的期望。
這些項目開始時非常小,但之后就會在最初的基礎上擴展開來。
為了避免將不必要的巨資投入大數據項目,最好像上述企業那樣做。所有最好的大數據科技資源都是開放的,所以在購買之前可以先試用,然后再根據各自的需求來選擇和發展最好的技術。