IDC:大數據仍存在炒作 但已具一定成熟度
IDC分析師表示,很少有流行術語像“大數據”得到如此多的炒作,雖然炒作仍然存在,但我們已經開始看到現實世界的成功例子,并且企業也開始制定大數據戰略。
“目前,我們仍然看到很多炒作,很多承諾,”IDC分析師Dan Vesset表示,“問題是現實情況是什么,以及企業在近期和短期內應該如何做?”
“我們可以安裝各種技術,但重要的是利用大數據改善決策過程,”Vesset表示,“你可以部署世界上最大的Hadoop,但這并不夠。”
IDC分析師Michael Versace表示,Progressive是使用大數據項目轉型其業務的公司之一,該公司利用客戶駕駛習慣的詳細信息,創建了一個基于使用情況的模型,從而確定價格政策。該公司通過駕駛員插入到汽車的診斷端口的設備來收集數據,該設備可以追蹤客戶猛踩剎車、夜間開車以及其他危險駕駛習慣的發生頻率。
與此同時,對于想要成功部署大數據項目的企業,他們也面臨著很多挑戰,這些包括:哪些業務數據應該被存儲,哪些應該被丟棄,獲取所需技術的成本以及缺乏具有必要技能的IT專業人士。Versace表示,在不久的將來,最后一個問題可能會變得更加嚴重。
人們對于大數據還存在一些誤解,例如,這并不完全是指社交媒體,還有人認為這完全是關于點擊流分析。并且,Hadoop也不是唯一的解決辦法,因為它主要針對大批量處理,而不是實時監控。 IDC估計,在北美約10%到12%的企業在以某種形式使用Hadoop。
IDC公司為大數據創建了“成熟度模型”,這涉及五個領域:數據、人、流程、技術和意圖。
企業開始大數據項目的第一個步驟是發掘以新方式利用其現有技術和數據的機會,評估公有云和開源選項,并開始通過概念證明和原型來試驗。在接下來的一到兩年,這些企業應該利用大數據項目的初步成功來為更大的項目籌集資金。
IDC分析師David Schubmehl表示,被認為是大數據的數據中有80%是非結構或半結構化信息。這種數據的多樣性將需要統一信息訪問技術來處理,例如Oracle的Endeca和IBM的Vivisimo等。
大數據的挑戰將繼續影響數據庫行業,圖形和內存數據庫平臺等技術越來越重要,另外,傳統關系型數據庫也將改變。