剖析:為什么我們應該殺死“大數據”?
老實說我以前是一個經常濫用大數據這個詞的人,似乎每一個新成立的企業都與大數據有關,就連風險投資公司也更愿意投資關于大數據的公司。
為什么我現在越來越不喜歡“大數據”這個詞了?因為我認為這個詞條本身是落伍的,它的定義由一系列的單詞構成,但這些單詞并沒有正確的反映了目前數據界發生了什么。現在,我們應該考慮的不是“大數據”,而是應該想一想我們能用數據做些什么。這些與運用分層數據創建的應用有關,也與這些應用能體現的深層意義有關。我不是第一個對大數據的夸夸其談感到厭煩的人,我與大量的投資者、數據專家以及企業家聊過,很多人與我有同樣的感受。
根據Vincent Mcburney的說法,“大數據”一詞起源于賓夕法尼亞大學的Francis Diebold,他在2000年7月寫的一篇關于金融建模的文章中首度提及此詞。從那時到現在已經超過了10年的時間,在此期間關于人們該如何運用大數據,發生了太多的事情。

大數據不僅僅只與大企業有關。事實上任何一個公司,從Facebook、Twitter這種巨人公司到Cloudera、Box、Okta這種快速發展的創業公司都是大數據公司,依照大數據的定義來看。每個有著一定用戶規模的公司都在搜集大量的數據,也就是“大數據”。在一個數據是產品創新關鍵的世界,成為一個“大數據”公司并不算什么獨特的事,老實說一點都不能說明一個公司的具體狀況。
根據IBM,大數據包括四個方面:數量、速度、多樣化以及真實性。在這個充滿了社交網絡、電子商務以及企業數據存儲的世界,這些因素在許多領域都有被應用到。大數據真的不能代表全部,既然我們有這么多不同的方法來篩選及使用這些大量數據的話。
這并非是低估在整理、分析大量數據方面創新的重要性。事實上,許多產業的未來,包括電子商務與廣告,都要依賴于對數據的處理。像GoodData、Infochimps、Moat等這些創業公司,都在研究讓數據能更好的為人所用的方法。
另一點值得指出的是,在大數據這個詞發明之前,像IBM、大型零售商、金融巨頭等大型企業就已經開始在分析大量數據上面花時間了。所以讓我們思考出另外一種方式來描述需要處理大量數據的創業公司吧,或許是和應用的實際功能與數據的對比有關。