成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

知名數(shù)倉技術(shù)及其核心思路,大盤點!

大數(shù)據(jù) 數(shù)據(jù)倉庫
Kylin是一個多維OLAP數(shù)倉。前文提到Hive的查詢延遲很高,尤其在復(fù)雜的多維分析中顯得格外明顯,難以滿足某些實時場景下的查詢需求。Hbase雖然可以解決一部分場景下的高延遲問題,但因為不支持SQL特性,所以也無法支持復(fù)雜的多維分析。

1?、Hive

Hive是一個基于HDFS(Hadoop Distributed File System , Hadoop分布式文件系統(tǒng))的數(shù)倉系統(tǒng),可以將存儲在HDFS之上的文件進行結(jié)構(gòu)化解析,并向用戶提供使用SQL操作Hadoop的能力。由于Hive構(gòu)建在基于HDFS和Spark/MapReduce的系統(tǒng)之上,使得Hive具備了理論上近乎無限的大數(shù)據(jù)處理能力,因此Hive迅速在業(yè)界占據(jù)主導(dǎo)地位,在其巔峰時期,Hive+SparkSQL就是大數(shù)據(jù)系統(tǒng)的標(biāo)配。Hive使用的是中間件思路,構(gòu)建在Hadoop的組件之上。

Hive本質(zhì)是一個元數(shù)據(jù)系統(tǒng),由于自身沒有存儲和計算引擎,因此Hive無法單獨使用,必須配合HDFS+Spark/MapReduce,才能完成整個數(shù)倉的功能。甚至Hive的元數(shù)據(jù)存儲都借助了MySQL等關(guān)系型數(shù)據(jù)庫。這樣的架構(gòu)設(shè)計使得Hive成為事實上的Hadoop中間件系統(tǒng),在大數(shù)據(jù)早期階段存在著如下非常重要的意義。

降低了Hadoop的技術(shù)門檻。

提高了Hadoop的使用效率。

投入產(chǎn)出比高。?

隨著技術(shù)的進步,Hadoop本身的問題越來越突出,使得Hive成為整個系統(tǒng)的瓶頸,這時候Hive的一些問題也隨之暴露,主要體現(xiàn)在以下幾點。

安裝運維困難:安裝Hive需要同時安裝更多的組件、易出現(xiàn)單點故障等。

受限于底層HDFS:小文件問題、不支持更新等。

受限于底層計算引擎:計算效率太低,延遲高無法支撐即席查詢等。

在ClickHouse技術(shù)尚未出現(xiàn)的年代,使用Hive需要同時配備非常龐大的大數(shù)據(jù)平臺,這使得傳統(tǒng)煙囪式數(shù)據(jù)開發(fā)模型由于成本原因無法在大數(shù)據(jù)時代早期廣泛應(yīng)用,因此出現(xiàn)了數(shù)據(jù)中臺的概念。建設(shè)數(shù)據(jù)中臺的一個重要原因是技術(shù)的不成熟使得大數(shù)據(jù)應(yīng)用成本非常高,企業(yè)沒有建設(shè)多個大數(shù)據(jù)平臺的動力,需要盡可能降低建設(shè)和維護成本,這就需要將所有數(shù)據(jù)整合到“大中臺小前臺”的架構(gòu)中,并由此誕生了一大批數(shù)據(jù)中臺的公司,極大地推動了產(chǎn)業(yè)的發(fā)展和技術(shù)的應(yīng)用。

煙囪式的數(shù)據(jù)開發(fā)模式在數(shù)據(jù)中臺時代被視為洪水猛獸,應(yīng)該絕對避免。當(dāng)然這個觀點在數(shù)據(jù)中臺時代是正確的。隨著大數(shù)據(jù)技術(shù)的成熟,使用全新技術(shù)的煙囪式數(shù)據(jù)開發(fā)模式其實也有著數(shù)據(jù)中臺無法比擬的優(yōu)勢——成本低、研發(fā)快、架構(gòu)靈活。這更體現(xiàn)出了計算機科學(xué)中的一個經(jīng)典理論——沒有銀彈。作為架構(gòu)師,應(yīng)該理性平等地分析每個架構(gòu)的優(yōu)點和缺點來找到最合適的架構(gòu),而不是找到正確的架構(gòu)。

2、HBase

和Hive類似,HBase也是建立在HDFS之上的NoSQL數(shù)據(jù)庫。和Hive不同的是,HBase實現(xiàn)了自己的存儲引擎,避開了HDFS低性能的缺陷,獲得了非常高的吞吐能力。由于HBase遠比Hive高的性能,因此在大數(shù)據(jù)的早期,部分場景也會將HBase當(dāng)成數(shù)據(jù)倉庫來使用。

HBase采用重新設(shè)計的存儲引擎解決了一些數(shù)倉的技術(shù)瓶頸。HBase的存儲引擎是面向NoSQL設(shè)計的,由于無法真正完整地實現(xiàn)SQL的能力,因此除了少部分不需要強大SQL能力的場景之外,HBase的使用非常有限。HBase的出現(xiàn)也有著非常重要的意義。

證明了基于低效的HDFS也能設(shè)計出相對高性能的系統(tǒng)。

彌補了Hive無法支持實時場景的缺陷。

填補了大數(shù)據(jù)系統(tǒng)即席查詢的空白,擴充了大數(shù)據(jù)的應(yīng)用場景.

3、Kylin

Kylin是一個多維OLAP數(shù)倉。前文提到Hive的查詢延遲很高,尤其在復(fù)雜的多維分析中顯得格外明顯,難以滿足某些實時場景下的查詢需求。Hbase雖然可以解決一部分場景下的高延遲問題,但因為不支持SQL特性,所以也無法支持復(fù)雜的多維分析。

Kylin就是在這樣的背景下應(yīng)運而生。Kylin的基本原理是復(fù)雜的多維分析查詢速度慢,那就提前計算好結(jié)果保存到HBase中,即可在需要時快速得出結(jié)果。Kylin采用將復(fù)雜計算前置的思路,降低了復(fù)雜計算的延遲。從本質(zhì)上看,可以認(rèn)為Kylin也是一個大數(shù)據(jù)中間件。Kylin也面臨著如下一些挑戰(zhàn)。

維度爆炸:Kylin的本質(zhì)上是將計算前置,由于很難事先預(yù)測需要組合維度,因此只能進行窮舉。這種窮舉的方式面臨著維度爆炸的風(fēng)險。

數(shù)據(jù)實時性弱:由于Kylin存在預(yù)計算過程,新的數(shù)據(jù)必須經(jīng)過預(yù)計算才能被檢索到,因此Kylin本質(zhì)上只是解決了實時查詢的問題,沒有解決數(shù)據(jù)無法實時響應(yīng)的缺陷。

資源浪費:由于預(yù)計算的結(jié)果并不一定會被使用,因此可能存在資源浪費的現(xiàn)象。

?指標(biāo)逃逸:所需的數(shù)據(jù)未被預(yù)計算,這種情況需要重新使用Spark/MapReduce進行計算。

4、其他數(shù)倉

以上介紹了三款常用的數(shù)據(jù)倉庫及其核心思路,這三種數(shù)倉分別采用了三種不同的思路來實現(xiàn)大數(shù)據(jù)下的數(shù)據(jù)倉庫。而其他的數(shù)倉,大多也是采用其中的一種或幾種思路,例如Greenplum采用的是Hive類似的中間件思路,只不過其底層數(shù)據(jù)庫是PostgreSQL而不是Hive的Hadoop。ClickHouse則是采用類似HBase的思路,以極限單機性能為目標(biāo),重新設(shè)計了存儲引擎和計算引擎。

本文摘編自《ClickHouse性能之巔:從架構(gòu)設(shè)計解讀性能之謎》,經(jīng)出版方授權(quán)發(fā)布。(書號:9787111716587)轉(zhuǎn)載請保留文章出處。

責(zé)任編輯:武曉燕 來源: 數(shù)倉寶貝庫
相關(guān)推薦

2012-09-11 09:36:21

2016-03-24 09:43:57

無線通信技術(shù)無線技術(shù)

2018-03-01 09:17:30

DevOps 技術(shù)開發(fā)語言

2010-09-06 09:25:42

Web應(yīng)用程序

2011-09-15 10:29:13

架構(gòu)

2021-03-19 08:00:00

網(wǎng)絡(luò)安全漏洞數(shù)據(jù)安全

2024-08-30 11:53:31

2023-12-03 09:10:00

技術(shù)業(yè)務(wù)數(shù)據(jù)分析

2011-09-05 16:39:59

黑客事件

2010-08-09 16:31:03

思科認(rèn)證

2020-11-02 11:24:52

算法人臉識別技術(shù)

2010-06-07 17:21:01

MySQL安裝

2025-03-06 09:00:00

前端AI開發(fā)

2011-05-04 13:07:56

打印機

2023-08-22 10:13:53

模塊工具JavaScrip

2023-03-15 23:59:13

前端構(gòu)建工具

2024-06-04 22:04:39

2024-04-08 00:00:00

前端框架React

2024-07-03 10:26:17

2015-08-26 09:18:16

云原生云原生機制云原生框架
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 涩涩导航 | 欧美福利视频一区 | 黄色精品 | av男人的天堂av | 国产成人av一区二区三区 | 国产精品www | 日本不卡一区 | 黄色免费在线观看网站 | 国产视频精品在线观看 | 欧美日韩在线播放 | 国产偷自视频区视频 | 在线观看视频一区二区三区 | 久久精品国产一区二区电影 | 国产精品99久久久久久久vr | 日本手机看片 | 亚洲视频免费在线观看 | 国产伦精品一区二区 | 欧美九九| 在线免费观看毛片 | 久热免费在线 | 亚洲男人天堂网 | 男人的天堂久久 | 在线一区二区三区 | 日韩在线中文字幕 | 密室大逃脱第六季大神版在线观看 | 成人欧美一区二区三区色青冈 | 国产黄色小视频在线观看 | 91影院| 国产欧美一区二区精品忘忧草 | av片在线免费看 | 亚洲一区二区久久久 | 国产精品自拍啪啪 | 国产精品精品视频一区二区三区 | 日本一区二区不卡 | 99tv成人影院 | 91精品国产91久久久久久最新 | 国产精品欧美一区二区 | 国产中文| 精品国产欧美一区二区三区不卡 | 久久亚洲精品国产精品紫薇 | 亚洲成人精选 |