專家談大數據來自何方 價值雖高但管理太難
原創數據的爆炸式增長為企業帶來了機遇與挑戰。社交計算、移動計算、云計算等新型計算模式的出現讓數據的產生方式跟傳統相比有了很大的不同。一方面數據的總量在變大,產生數據的來源也更加分散,不再像以往僅僅是產生自企業內部的IT系統;另一方面非結構化數據在增多,這些數據不同于擁有一定關系的可以在數據表中逐行記錄的結構化數據,非結構化數據通常存在于影像、郵件、文檔、社交平臺中,他們的體積龐大,而使有價值的信息不易被發現。
了解大數據來自何處,能夠幫助我們更好的進行數據集成和抓取,用以分析出結論后優化業務決策。在今天舉辦的第二屆大數據論壇上,Forrester的分析師曹宇欽認為大數據來源于企業內部、外部、產業生態鏈的上下游客戶、社交媒體、移動終端等等地方。
大數據來自企業內部/外部/客戶/社交媒體
Oracle全球副總裁喻思成認為,“大數據來自于泛互聯網數據,機器產生的數據,以及行業內容的數據。這些數據可以用4個‘V’表示,即巨大的數據量、多結構化數據、增長速度很快、價值很大但是密度低。處理這些大數據最核心的兩項技術便是Hadoop、NoSQL。”
管理和處理大數據有難度
本屆大會上,Intel公司行業合作與解決方案中國區總監凌琦對大數據進行了比較形象的解讀,他通過兩個維度來描述數據,一條維度是數據類型,另一條維度是數據規模。通過維度交叉的區間可以看出相應的數據特點。
大數據的時代正在到來
如圖所示。小規模的非關系型數據集僅可以為我們提供有限的分析價值;小規模的關系型數據也僅能作為傳統商業智能的分析對象;大規模的關系型數據提供的擴展性和參考性非常有限。而大規模的非關系型數據集將是真正為企業帶來價值的數據信息,這便是大數據。凌琦先生表示,“根據IDC的預測,全球的數據使用量到2020年會增長44倍,達到35.2ZB(1ZB=10億TB)?!北ㄊ降臄祿鲩L趨勢證明了大數據的時代正在到來。
凌琦列舉了大數據來源的一些場景:
•社交網絡
•移動網絡和各種智能終端
•商業數據與信息
•傳感器、RFID閱讀器、導航終端等非傳統IT設備
•視頻(醫療影像、地理信息、監控等)
通過上面大數據來源場景的描述,我們發現這些數據內容正是來自我們身邊的信息系統和網絡平臺。但是有了這些大數據應該怎么來使用和分析?怎樣通過計算出的結論來優化業務決策,這些是我們在實現了大數據的捕獲和收集后更需要集中注意力來做的事情。