五個角度淺析大數據與BI的區別
BI(Business Intelligence),中文翻譯是商務智能,是一套完整的解決方案,用來將組織中現有的數據進行有效的整合,快速準確的提供報表并提出決策依據,幫助組織做出明智的業務經營決策。
大數據(Big Data)是從收集的海量數據中,通過算法將這些來自不同渠道、格式的數據進行直接分析,從中尋找到數據之間的相關性。簡單而言,大數據更偏重于發現,以及猜測并印證的循環逼近過程。

不管定義如何不同,大數據與傳統BI是社會發展到不同階段的產物,我們從幾下幾個緯度來可以迅速的看出兩者的區別:
***、從數據來源角度
大數據應用的數據來源,不僅僅包括非結構化的數據,還有各種系統數據,數據庫數據。其中非結構化數據主要是集中在互聯網以及一些社交網站上的數據以及一些機器設備的數據,這些都構成了大數據應用的數據來源。對于大數據的分析工具來說,現階段也是對于非結構化的數據分析的比較多。
BI系統則是在數據集成方面的技術越來越成熟,對于數據的提取,一個各種數據挖掘的要求來說,數據集成平臺會幫助企業實現數據的流通和交互使用,在企業內部實施BI應用就是為了可以更好的對數據進行分享和使用。
第二、從思維方式角度
大數據對于傳統BI,既有繼承,也有發展,從”道”的角度講,BI與大數據區別在于前者更傾向于決策,對事實描述更多是基于群體共性,幫助決策者掌握宏觀統計趨勢,適合經營運營指標支撐類問題,大數據則內涵更廣,傾向于刻畫個體,更多的在于個性化的決策。

第三、從發展方向角度
BI的發展要從傳統的商務智能模式開始轉換,對于企業來說,BI不僅僅是一個IT項目,更是一種管理和思維的方式,從技術的部署到業務的流程規劃,BI迎來新的發展。對于大數據來說,現階段更多的大數據關注在非結構化數據,不同的數據分析工具的出現和行內的應用范圍不斷的加大,對于大數據應用來說,怎么與應用的行業進行一個深層次的結合才是最重要的。
第四、從工具的角度
傳統BI使用的是ETL、數據倉庫、OLAP、可視化報表技術,屬于應用和展示層技術,目前都處于淘汰的邊緣,因為它解決不了海量數據(包括結構化與非結構化)的處理問題。而大數據應用的是一個完整的技術體系,包括用Hadoop、流處理等技術解決海量的結構化、非結構化數據的ETL問題,用Hadoop、MPP等技術計算海量數據的計算問題,用redis、HBASE等方式解決高效讀的問題,用Impala等技術實現在線分析等問題。因此是個全新的行業。
第五、從人員的角度
傳統BI只要掌握核心的SQL技術就可以從事BI的工作,而大數據的數據處理,涉及太多新的技術,不同的應用場景需要不同的大數據處理方法了,而且不再有人機交互那么好的客戶端了,至少要懂流處理、HADOOP、列式或分布式鍵值數據庫吧,還需要能在SPARK上開發算法程序,對于用戶畫像、產品標簽化、推薦系統、排序算法都應有所理解。
因此,大數據相對于傳統BI,不是簡單的PLUS的關系,它涉及了思想、工具和人員深層次的變革,BI工作人員應該盡快順應大勢,更新自己,奮起直追,重裝上陣。