成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大數據的核心是云技術和BI

大數據
整體來看,未來的趨勢是,云計算作為計算資源的底層,支撐著上層的大數據處理,而大數據的發展趨勢是,實時交互式的查詢效率和分析能力,當前的大數據處理一直在向著近似于傳統數據庫體驗的方向發展。

關于大數據和云計算的關系人們通常會有誤解。而且也會把它們混起來說,分別做一句話直白解釋就是:云計算就是硬件資源的虛擬化;大數據就是海量數據的高效處理。如果做一個更形象的解釋,云計算相當于我們的計算機和操作系統,將大量的硬件資源虛擬化之后再進行分配使用;大數據則相當于海量數據的“數據庫”。

整體來看,未來的趨勢是,云計算作為計算資源的底層,支撐著上層的大數據處理,而大數據的發展趨勢是,實時交互式的查詢效率和分析能力,當前的大數據處理一直在向著近似于傳統數據庫體驗的方向發展。

 

[[237241]]

大數據的4V特性,即類型復雜,海量,快速和價值,其總體架構包括三層,數據存儲,數據處理和數據分析。類型復雜和海量由數據存儲層解決,快速和時效性要求由數據處理層解決,價值由數據分析層解決。數據先要通過存儲層存儲下來,然后根據數據需求和目標來建立相應的數據模型和數據分析指標體系對數據進行分析產生價值。而中間的時效性又通過中間數據處理層提供的強大的并行計算和分布式計算能力來完成。三層相互配合,讓大數據最終產生價值。

數據存儲層

數據有很多分法,有結構化,半結構化,非結構化;也有元數據,主數據,業務數據;還可以分為GIS,視頻,文件,語音,業務交易類各種數據。傳統的結構化數據庫已經無法滿足數據多樣性的存儲要求,因此在RDBMS基礎上增加了兩種類型,一種是hdfs可以直接應用于非結構化文件存儲,一種是nosql類數據庫,可以應用于結構化和半結構化數據存儲。

從存儲層的搭建來說,關系型數據庫,NoSQL數據庫和hdfs分布式文件系統三種存儲方式都需要。業務應用根據實際的情況選擇不同的存儲模式,但是為了業務的存儲和讀取方便性,我們可以對存儲層進一步的封裝,形成一個統一的共享存儲服務層,簡化這種操作。從用戶來講并不關心底層存儲細節,只關心數據的存儲和讀取的方便性,通過共享數據存儲層可以實現在存儲上的應用和存儲基礎設置的徹底解耦。

數據處理層

數據處理層核心解決問題在于數據存儲出現分布式后帶來的數據處理上的復雜度,海量存儲后帶來了數據處理上的時效性要求,這些都是數據處理層要解決的問題。

在傳統的云相關技術架構上,可以將hive,pig和hadoop-mapreduce框架相關的技術內容全部劃入到數據處理層的能力。原來我思考的是將hive劃入到數據分析層能力不合適,因為hive重點還是在真正處理下的復雜查詢的拆分,查詢結果的重新聚合,而mapreduce本身又實現真正的分布式處理能力。

mapreduce只是實現了一個分布式計算的框架和邏輯,而真正的分析需求的拆分,分析結果的匯總和合并還是需要hive層的能力整合。最終的目的很簡單,即支持分布式架構下的時效性要求。

數據分析層

***回到分析層,分析層重點是真正挖掘大數據的價值所在,而價值的挖掘核心又在于數據分析和挖掘。那么數據分析層核心仍然在于傳統的BI分析的內容。包括數據的維度分析,數據的切片,數據的上鉆和下鉆,cube等。

數據分析我只關注兩個內容,一個就是傳統數據倉庫下的數據建模,在該數據模型下需要支持上面各種分析方法和分析策略;其次是根據業務目標和業務需求建立的KPI指標體系,對應指標體系的分析模型和分析方法。解決這兩個問題基本解決數據分析的問題。

傳統的BI分析通過大量的ETL數據抽取和集中化,形成一個完整的數據倉庫,而基于大數據的BI分析,可能并沒有一個集中化的數據倉庫,或者將數據倉庫本身也是分布式的了,BI分析的基本方法和思路并沒有變化,但是落地到執行的數據存儲和數據處理方法卻發生了大變化。

談了這么多,核心還是想說明大數據兩大核心為云技術和BI,離開云技術大數據沒有根基和落地可能,離開BI和價值,大數據又變化為舍本逐末,丟棄關鍵目標。簡單總結就是大數據目標驅動是BI,大數據實施落地式云技術。

責任編輯:未麗燕 來源: 西部數碼
相關推薦

2016-10-27 14:24:46

大數據傳統BI

2015-08-31 13:29:31

大數據能力華為

2014-03-10 17:41:08

硬盤云計算大數據時代

2013-07-22 09:46:39

大數據云計算BI

2024-02-20 13:16:00

大數據數據倉庫數據湖

2022-10-18 15:21:25

大數據管理技術數據倉庫

2018-06-25 11:20:18

LinuxPython大數據

2011-11-05 09:39:44

云計算大數據

2013-10-09 10:13:09

甲骨文

2019-03-05 14:57:21

大數據Hadoop框架

2018-01-04 13:39:34

大數據云計算IT行業

2021-05-08 09:14:55

云計算大數據人工智能

2023-04-06 00:29:01

2021-01-04 10:49:46

人工智能大數據

2021-01-04 13:50:31

BI商業智能永洪科技

2014-07-21 09:01:04

敏捷BI

2021-03-15 10:43:20

大數據數據分析工具

2013-09-03 09:14:12

2015-03-06 17:48:27

大數據云計算浪潮

2015-08-20 13:39:49

云服務大數據
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文字幕在线精品 | 涩涩视频在线观看 | 久久青青 | 美女午夜影院 | 日韩精品一区二区三区在线播放 | 欧美一区二区三区在线播放 | 欧美精品一区久久 | 99re免费| 欧美精品一区三区 | 亚洲不卡在线观看 | 日韩视频在线一区 | 在线中文字幕日韩 | 一区二区三区在线免费观看 | 欧美激情综合色综合啪啪五月 | 免费在线观看成人 | 精品国产乱码久久久久久果冻传媒 | 桃花av在线| 国产91精品久久久久久久网曝门 | 国产精品1区2区3区 中文字幕一区二区三区四区 | 国产成人综合亚洲欧美94在线 | 欧美日韩在线观看视频 | 亚洲成人av | 一级在线 | 99久久久无码国产精品 | 国产精品一区一区 | 欧美成年人网站 | 国产一级淫片免费视频 | 欧美一区二区三 | 色爱区综合 | 一级片在线视频 | 免费在线观看成人 | 国产精品日韩欧美一区二区 | 亚洲视频中文字幕 | 亚洲精品一区二区在线 | 一区二区三区四区国产 | 在线中文字幕av | 国产免费一区二区 | 国产日韩精品视频 | 亚洲综合无码一区二区 | 免费h视频| 久久精品|