大數(shù)據(jù)就是一堆沒用的東西嗎?
許多公司已經(jīng)在積極使用大數(shù)據(jù),只是它們沒有稱之為大數(shù)據(jù)罷了。雖然“大數(shù)據(jù)”一詞有諸多爭議,可是這項技術還是變得對公司業(yè)務來說必不可少。
據(jù)Dresner咨詢服務公司的一項新調查顯示,幾乎沒人能說清大數(shù)據(jù)到底是什么鬼;而且參與調查的所有公司,也幾乎都沒用大數(shù)據(jù)做真正有意義的事兒。
是不是覺得很吃驚?
其實也沒什么好吃驚的。就算是許多年前就有人預言大數(shù)據(jù)的出現(xiàn),可歸根結底,大多數(shù)公司還是把全部的精力,投入到如何將小數(shù)據(jù)充分利用起來。
這倒不是說大數(shù)據(jù)沒那么重要。誰也不能否認,企業(yè)如今從數(shù)據(jù)中收獲頗多。因為事實就是這樣。但是,想從大數(shù)據(jù)中獲得價值,企業(yè)首先要變得務實。
誰需要大數(shù)據(jù)?
正如Datamation雜志的詹姆斯·馬奎爾(James Maguire)所寫,Dresner咨詢服務公司并沒有看到大數(shù)據(jù)獲得大規(guī)模部署的現(xiàn)象。
只有17%的公司承認正在使用大數(shù)據(jù),另有47%表示計劃未來使用,但何時使用還不確定。如此看來,難怪報告***得出的結論是:“盡管經(jīng)過了長期的造勢和炒作,眼下大數(shù)據(jù)分析技術的實際部署,仍然無法廣泛適用于大多數(shù)企業(yè)組織。”
大數(shù)據(jù),就是一大堆沒用的東西嗎?
答案當然是否定的。畢竟,在報告調查的對象中,有59%的觀點表明,大數(shù)據(jù)“至關重要”,盡管他們現(xiàn)在并沒有明顯地感覺到,有用什么大數(shù)據(jù)處理的任務。那么這里,顯然這里有某個因素在作祟……
我堅定地認為,一 定是有“某個東西”。
你不斷使用那個詞……
早在2012年,NewVantage Partners就顛覆了公眾對于大數(shù)據(jù)中“大”的定義。盡管在Hadoop及其生態(tài)系統(tǒng)的廠商的幕后推手下,媒體大肆報道PB級數(shù)據(jù)問題,但事實上大多數(shù)公司根本不存在所謂的PB級數(shù)據(jù)問題。
正如這項調查所發(fā)現(xiàn)的那樣,企業(yè)面臨的主要問題,還是數(shù)據(jù)的種類和處理速度。
市場終于心領神會,開始將越來越多的資金投入到可以更輕松地管理不同類型數(shù)據(jù)的技術上(比如MongoDB等NoSQL數(shù)據(jù)庫和DataStax版本的Cassandra),以及處理流數(shù)據(jù)的技術上(比如Apache Spark)。
與此同時,企業(yè)繼續(xù)求助于更傳統(tǒng)的數(shù)據(jù)基礎設施,比如甲骨文。就像DB-Engines在2015年年底盤點中發(fā)現(xiàn)的那樣,甲骨文在去年***的廠商評比中,漲幅***(綜合衡量發(fā)布崗位、技術論壇提及率和谷歌搜索等方面)。
它甚至超過風頭正勁的NoSQL,超過云優(yōu)先的亞馬遜,超過其他任何廠商或技術。
當然,甲骨文這種人氣的上揚,某種角度講與大數(shù)據(jù)關系不大,而是緣于管理整齊的行列數(shù)據(jù)。但是從NewVantage Partners的調查數(shù)據(jù)來看,這種比較“小”的數(shù)據(jù)才恰恰是大多數(shù)大數(shù)據(jù)分析技術的處理對象。
另外,拋開結構化數(shù)據(jù),我想也許許多公司還是不認為多樣化、高速度的數(shù)據(jù),就是“大數(shù)據(jù)”。這可能是很少有公司聲稱自己在對大量任務進行處理時,實際已經(jīng)使用大數(shù)據(jù)技術的一個原因。
正如MySQL數(shù)據(jù)庫工程師賈斯汀·斯旺哈特(Justin Swanhart)所說:“大數(shù)據(jù)毫無意義。你還不如問別人他們想要哪種數(shù)據(jù)庫。”
總而言之,就算大數(shù)據(jù)如此活躍地出現(xiàn)在人們的視野中,但許多公司未必認為它就是“大數(shù)據(jù)”。
那又如何?
對于正在想自己是不是被大數(shù)據(jù)甩在后頭的企業(yè)來說,別再瞎擔心了。正如Gartner的分析師尼克·霍德克(Nick Heudecker)所說,“大數(shù)據(jù)”已遷移到大家更熟悉的領域中:
- 先進分析和數(shù)據(jù)科學
- 商業(yè)智能和分析
- 企業(yè)信息管理
- 內(nèi)存中計算技術
- 信息基礎設施
很多企業(yè)已經(jīng)在充分利用大數(shù)據(jù)做項目,只是不把它們稱之為大數(shù)據(jù)。即便如此,有大量工作還是沒有做到位。
正如麻省理工學院斯隆學院數(shù)字商業(yè)中心的研究員邁克爾·施拉格(Michael Schrage)所說:“預測分析產(chǎn)生的最深遠的影響,并不來自大幅改進預測質量,而是使企業(yè)從根本上轉變考慮問題和機遇的角度。”
換句話說,許多公司可能并不缺少將大數(shù)據(jù)充分利用起來的必要技術。他們?nèi)鄙俚模菍ふ覐氐讓?shù)據(jù)充分利用起來的那種方式的渴望。分析員們解讀數(shù)據(jù)是一回事,而真正利用分析結果扒動公司業(yè)務的實時變化,則是另外一回事。
這不是你從某家廠商所能買到的那種東西。它一定需要在企業(yè)的DNA內(nèi)部發(fā)生變化。既要更準確地了解大數(shù)據(jù),又要用大數(shù)據(jù)切實處理一些任務,企業(yè)確實面臨艱巨的任務。
文章轉載自微信公眾號“一斑”(ID: yiban51CTO)