成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大數據時代,OLAP解析與發展方向

大數據 數據分析
數據分析領域自2010前后一直占據了全球信息技術的核心地位,OLAP的需求并未隨著Hadoop的流行而消亡,而是被越來越理智的認可——“數據再多也需要分析、分析的主要需求還是交互查詢”。本文概括了OLAP的本質原則、曾經的困境和當前的技術派系,希望能引起從業者的思考,共同促進行業進步與發展!

前言:數據分析領域自2010前后一直占據了全球信息技術的核心地位,OLAP的需求并未隨著Hadoop的流行而消亡,而是被越來越理智的認可——“數據再多也需要分析、分析的主要需求還是交互查詢”。本文概括了OLAP的本質原則、曾經的困境和當前的技術派系,希望能引起從業者的思考,共同促進行業進步與發展!

1. 剖析OLAP本質

OLAP(Online Analytical Processing)是一種數據處理技術,專門設計用于支持復雜的分析操作,側重對決策人員和高層管理人員的決策支持,可以根據分析人員的要求快速、靈活地進行大數據量的復雜查詢處理,并且以一種直觀而易懂的形式將查詢結果提供給決策人員,以便他們準確掌握企業(公司)的經營狀況

二十幾年前E.F. Codd提出OLAP時,也參照關系數據庫提出了12條規則,但后期沒有得到發展,其中有些規則在現在看來都已經不再完全適用,或者不是OLAP的特殊規則。因此我們從OLAP的本質定位上,重新確定三條原則,用以解析OLAP的歷史發展:

1) 提供多維的業務視圖(“維”是OLAP存在和核心概念)

2) 滿足靈活的交互分析(面向決策分析需要及時響應查詢需求的變更)

3) 提供高速的檢索性能(沒有人希望查詢數據等待太長時間)

無論從E.F. Codd提出的12條規則中,還是本文提煉的三大原則中,都可以明確出OLAP是滿足應用需求而研發的新技術,而且是以“維度”為核心概念的所有技術的統稱。

2. OLAP vs Reporting

從事BI/DW的專業人士們,對這張架構圖應該非常熟悉,其中同時出現了OLAP和Reporting兩個面向用戶的應用功能(數據挖掘暫且忽略)。

兩者核心的區別在于OLAP可以讓終端用戶可隨意更改格式,以及進行維度鉆取,甚至自定義成員,而Reporting的終端用戶只能按照開發人員的預置做有限交互(比如刷新參數等)。同時從后臺原理上,OLAP通過預計算(空間換時間的思想)做到高速響應,Reporting一般通過對關系型數據庫的模型和優化保證既定SQL的高速查詢。

為什么提到Reporting,因為它是OLAP出現之前的唯一數據應用,也正是因為Reporting解決不了大規模數據的交互分析,才誕生了OLAP。

3. OLAP遇到的困難

OLAP核心三原則的“多維”通過星型/雪花模型得以保證(已經有OLTP能參考的經驗)、“靈活交互”和“高速響應”通過基于“預計算”數據的交互查詢而實現。這就順理成章的讓我們聯想起多維表達式——MDX(MultiDimensional eXpressions),此技術在E.F.Codd提出OLAP四年后就被微軟定義并使用。

Multidimensional Expressions (MDX) is a query language for OLAP databases. Much like SQL, it is a query language for relational databases.

MDX是類似SQL的查詢語言,只不過查詢的是OLAP數據庫。

當微軟發明MDX后,眾多廠商都相繼跟進并應用了這個非公開標準的技術,比如Oracle、SAS、Teradata、Cognos、Business Objects等等,從而使得MDX成為了OLAP領域的必備技術。

熟悉OLAP的朋友都知道MOLAP、ROLAP、HOLAP,它們都是時間與空間平衡關系的產物,比如MOLAP犧牲了空間和時效性,過度滿足了查詢性能,ROLAP保證了空間和時效性,卻又容易喪失前端查詢的高性能,最后發展出混合型的HOLAP。無論后端如何變化,前端的MDX卻從來沒有改變過(2008年我曾參加的面試題,里面就全部都是MDX語法)。

言歸正傳,為什么說OLAP的發展遇到了苦難呢,有這么幾點:

1、 OLAP產品的封閉性

雖然前端查詢的默認標準是MDX,但由于MDX的不夠普及和易用,實際得以商業應用的軟件中很多都自成一體(所謂成熟的商業軟件),比如IBM Cognos等,造成前端功能的受限和不易集成。只有Microsoft SSAS、Oracle Essbase、Mondrian等少數幾個可以把服務端以XML for Analysis標準開放出來,提供比較好的開發和集成能力。

2、 OLAP的預建模瓶頸

傳統的OLAP軟件,無論MOLAP/ROLAP/HOLAP,都會為用戶的使用提前設計一個星型模型,它的好處是便于用戶在一個存在相關關系的數據范圍內操作,避免出現查詢結果的錯誤。但帶來的問題就是,當業務需求變化快或者業務關聯更新時,模型就需要重構,而且必須由IT人員負責重構,較低的變更效率影響了使用感受。

3、 xOLAP都滿足不了大數據的分析

凡事都存在量變到質變,數據量一旦大到TB、PB的程度,無論是基于文件的MOLAP,還是基于數據庫的ROLAP,就都不能滿足第三原則(高速響應)了。尤其很多客戶已經采用Hadoop的數據架構,傳統的OLAP技術就很難融入其中了!

4、 OLAP可視化能力弱

熟悉OLAP產品前端操作的用戶都清楚,拖拽、下鉆、切片這些動作都是基于表格的,基本不能在圖形上完成同樣的操作,這就給OLAP帶來一個基因上的缺陷,就是可視化能力不夠。還不要提現在時髦的玫瑰圖、網絡圖、桑基圖等等可視化圖形!

5、 MDX不如SQL普及

MDX在很多統計分析功能上得天獨厚,又比如協方差等計算函數,但80%的真正需求還是定位在簡單的分級匯總和鉆取切片排序上。無論在學習資源還是普及程度上,SQL還是擁有最多人群的數據查詢技術。SQL的接受程度從在Hadoop生態的回歸就能知道!

技術從來就不能阻擋需求,這些問題存在了若干年后,最近OLAP出現了很多新的技術實現,從多個方向帶來了新的選擇。

4. OLAP的技術派系

OLAP作為一大類市場需求始終是存在的,需要發展的只是實現它的技術(OLTP所基于的RDBMS非常穩定)。現在OLAP技術發展了20多年,正處于群雄逐鹿階段,無論未來有沒有一統江湖的完美技術,至少從現在來看,我們有必要從OLAP本質三原則梳理技術派系,以便市場參考和個人選擇:

1. 傳統OLAP

尊重傳統是技術領域最缺少的品德,傳統OLAP中尤其是Mondrian和SSAS還是有不少用戶群的(前者是開源軟件),反而選用Cognos、MSTR等的越來越少。

2. 可視化OLAP

十幾年前,最火爆的BI產品是BO(2007年以68億美元被SAP收購)。BO里最早的核心技術叫做“動態微立方”,就是把基于語義模型查詢的結果集數據以MOLAP的方式存儲在內存中,以加快后期交互分析的效率。現在同樣也有各種基于內存計算的軟件,但它們是以可視化為主,比如Tableau和Qlikview等。單純定位在可視化上的OLAP只有商業軟件,沒有開源也沒有免費的選擇,這是因為可視化是個短期需求吧。

3. 大數據OLAP

Hadoop的生態系統誕生于互聯網公司,從一開始就有開放的基因,這個OLAP派系最有意思的是Kylin,而且是咱中國人在Apache上的定級項目。“Apache Kylin™是一個開源的分布式分析引擎,提供Hadoop之上的SQL查詢接口及多維分析(OLAP)能力以支持超大規模數據,最初由eBay Inc. 開發并貢獻至開源社區。”它與前2者最大不同點在于2個:使用SQL進行查詢和支持Hadoop(SQL、SQL、SQL,重要的事情說三遍J)!準確的說,Kylin只是一個OLAP server,它的前端可以選用Smartbi等免費或者商業的軟件,也可以選擇自己開發。

4. 辦公OLAP

最后一個派系也不可小視,那就是微軟Excel(WPS等電子表格軟件還難以匹敵)。雖然它也是自有的封閉技術,但它的友好性和兼容性足夠強大,幾乎人人電腦上都能使用,而且也確實是每個數據分析人員都略會一二的工具軟件。而且它更重要的價值在于在Excel里面可以維護和處理數據,這是其它3類OLAP都無法提供的。具體介紹網上有很多,大家可以關注中國電子表格應用大會、Excelhome等網絡資源。

最后還是強調OLAP是除了報表Reporting和數據挖掘Mining以外的一大類數據分析需求,在遵從“多維”、“靈活交互”和“高速響應”三個本質原則情況下,無論你是辦公一族還是軟件工程師、大數據專家,都有適合你的OLAP軟件工具!

數據的聯機分析處理,不會隨著時間淡出,只會隨著數據化運營的管理觀念普及而加強!

責任編輯:武曉燕 來源: 網絡大數據
相關推薦

2016-11-22 13:17:36

大數據OLAP

2024-01-29 08:20:03

物化視圖StarRocksOLAP系統

2009-10-14 15:06:22

IT職業發展

2013-10-23 10:03:39

大數據

2021-11-05 21:54:58

云存儲數據安全

2014-08-04 10:22:26

大數據

2020-12-17 13:51:35

人工智能人工智能發展方向

2022-05-11 10:48:56

模型JavaScript框架

2009-10-21 15:43:38

綜合布線市場

2019-10-14 15:14:17

存儲云存儲人工智能

2016-05-13 10:20:43

大數據應用數據管理數據分析

2016-10-19 18:36:50

大數據大數據應用

2016-12-12 13:32:32

2017-08-24 10:25:53

數據中心光模塊技術

2010-02-04 11:20:29

網絡數據交換技術

2019-12-09 14:55:00

大數據

2025-01-13 09:44:16

人工智能AI芯片

2010-07-20 11:03:10

程序員

2012-06-05 08:48:02

服務器虛擬化IT硬件創新

2009-10-26 17:13:42

ADSL接入技術
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品一区二区久久 | wwwxxx国产 | 伊人久麻豆社区 | 亚洲成人天堂 | 91精品国产乱码久久久久久久久 | 黄网免费 | 成人性视频免费网站 | 欧美一区二区三区国产精品 | 秋霞av国产精品一区 | 91精品久久久久久久久久入口 | 久久99精品国产 | 成人av播放 | 黄色男女网站 | 亚洲视频免费在线观看 | 亚洲一区二区久久 | 日本黄色一级片视频 | 亚洲精品电影网在线观看 | 免费久久久 | 亚洲一区 中文字幕 | 国产日韩欧美一区 | 亚洲一区 中文字幕 | 中文字幕一二三 | 天天躁日日躁性色aⅴ电影 免费在线观看成年人视频 国产欧美精品 | 欧美精品一区二区三区在线 | 日本韩国欧美在线观看 | 国产精品成人一区二区三区 | 黄网站免费在线观看 | 欧美亚洲国产一区二区三区 | 亚洲精品久久久久久首妖 | 羞羞视频网站 | 成人看片在线观看 | 日韩伦理一区二区三区 | 黄色大片免费观看 | 日日做夜夜爽毛片麻豆 | 草久久免费视频 | 国产亚洲欧美在线 | 欧美老妇交乱视频 | 欧洲视频一区二区 | 久久99深爱久久99精品 | 夜夜爽99久久国产综合精品女不卡 | 国产精品96久久久久久 |