大數據十大核心問題
大數據來了,受益于便宜的硬件存儲、強大的計算機技術和云計算技術,企業手中獲取了越來越多的數據。對大多數企業來說,數據分析不是可有可無,而是一個生存問題。但是面對大數據,我們有什么問題呢?本文作者賽仕軟件研究開發(北京)有限公司總經理@劉政-SAS,在微博上分享的大數據的10個核心問題,中國統計網做個整理匯總,希望大家一起來交流討論。
大數據十大核心問題:
1、大數據的分析模式
大數據分析與傳統分析的區別,特點是什么?
2、分析速度
分析速度是否能夠跟上數據量和數據格式變化的速度,是否能達到實時分析?
3、多種格式數據的分析技術
聲頻、視頻、圖片、文本等等格式,如何混合分析?
4、存儲問題,存儲和分析成本
無條件存儲,還是有選擇性存儲?如何進行選擇性存儲?投入產出比。隨著數據量的不斷增加,存儲技術要不斷創新。
5、法律條款的更新
個人隱私,國家機密保護等。數據的歸屬權問題。我通過開放的數據,分析出了國家機密,是不是違規、犯罪?
6、數據安全和真實性
數據是否會被竊取,篡改,偽造等,如何保護?
7、數據流分析
給進數據,輸出分析結果,實時改變,是物聯網實用化的基礎。如何實現?
8、數據關聯性
如何提取關聯性數據和有用數據?看起來簡單,其實在浩瀚的數據中查找關聯性是挺難的。
9、大數據能否引申出科學***?
例如,骰硬幣可以引出概率論。
10、大數據對其他學科的影響
對大數據的分析僅僅是得到分析結果嗎?應該說世界上所有的東西都可以歸結到數據里。那么我們能由此對世界有更深的了解嗎?有了基因數據,人體數據能繪出人體機能嗎?