成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Hadoop上開源的類SQL實時查詢系統(tǒng)對比

開源 Hadoop
總體來說雖然impala、stinger、drill三個系統(tǒng)都是類SQL實時查詢系統(tǒng),但是它們的側(cè)重點(diǎn)完全不同。而且它們也不是為了替換Hive而生,hive在做數(shù)據(jù)倉庫時還是很有價值的。

以前只用過Hive與impala兩個類SQL查詢系統(tǒng),最近又將Hortonworks開源的Stinger與Apache的Drill做了些調(diào)研。累死累活搞了一天的資料,頭都大了。為了紀(jì)念我那逝去的腦細(xì)胞,特將這些信息整理出來。

由于調(diào)查時間比較短(一天的時間都頭暈眼花了,再長點(diǎn)估計我就要過勞死了),所寫之處難免會有差錯,歡迎大家指正。

總體來說雖然impala、stinger、drill三個系統(tǒng)都是類SQL實時查詢系統(tǒng),但是它們的側(cè)重點(diǎn)完全不同。而且它們也不是為了替換Hive而生,hive在做數(shù)據(jù)倉庫時還是很有價值的。

目前來說只有impala比較成熟(人家標(biāo)稱要使用CDH版本hadoop,如果要使用apache的,要做好測試的心里準(zhǔn)備)。

其它兩個系統(tǒng)還都處理孵化狀態(tài),但是前景非常不錯。


Impala

這個系統(tǒng)是Cloudera開源的,時間大約是在12年下半年。雖然到現(xiàn)在才一年的時間但是已經(jīng)有很多人在使用。社區(qū)也比較活躍,大家可以在github上面看到項目的開發(fā)人員與代碼提交情況(地址:https://github.com/cloudera/impala)。個人感覺開發(fā)者雖然有其它幾個公司,但是還是以cloudera為主。這樣也造就了impala開發(fā)的比較快速,雖然到現(xiàn)在才一年左右的時間,但是impala已經(jīng)可以很穩(wěn)定的運(yùn)行。

impala主要是為hdfs與hbase數(shù)據(jù)提供實時SQL查詢。它是根據(jù)google的dremel論文實現(xiàn)的一套分布式系統(tǒng),自用戶提交的SQL開始都是基于自身的分析器與執(zhí)行器。下圖是其架構(gòu)圖

 

(圖片源自:impala安裝使用說明書)

由于完全脫離了M/R技術(shù),自身根據(jù)HDFS的文件分布來調(diào)整計算,所以速度較Hive有很大提升。根據(jù)我個人使用部分TPC基準(zhǔn)測(為什么是部分?沒理 由,我只選了一部分SQL來跑),impala雖然性能提升不像Cloudera標(biāo)稱的達(dá)到hive的一百倍,但是在比較復(fù)雜的情況下達(dá)到40-70倍性 能提高還是有的。

就日常使用來說,標(biāo)稱是支持大部分SQL-92標(biāo)準(zhǔn)(我也不清楚這個標(biāo)準(zhǔn)到底有多少,專業(yè)的童鞋給點(diǎn)解讀唄!!)。根據(jù)我 是測試,日常用的SQL都沒有問題。并且impala支持JDBC與ODBC的連接,這對于我們的使用也是很必要的,基于此特點(diǎn)我們可以開發(fā)對應(yīng)業(yè)務(wù)系統(tǒng) 的UI部分,從而不用要求業(yè)務(wù)人員自己下SQL了(這是為數(shù)不多的展現(xiàn)工作成果的時候了)。

其次就是impala支持的文件格式,我們存取 數(shù)據(jù)的時候肯定要應(yīng)景的選擇壓縮與否以及文件的存儲格式。impala支持常用的Text、Sequence、avro格式,壓縮方面支持Snappy、 bzip、gzip以及deflate壓縮應(yīng)該可以滿足我們大部分的使用場景了。

而最棒的是它的UDF功能可以直接使用hive的udf庫,而不需要修改任何代碼,使用hive的童鞋可以慶祝了,很多任務(wù)不需要任何改變即可平滑切換impala。不過因為impala使用的是C開發(fā)的,所以impala還是鼓勵大家寫一個c下面的udf來提高性能。


drill

開源時間跟impala差不多,只不過屬于Apache,。這個系統(tǒng)的目標(biāo)很宏大--抽象所有數(shù)據(jù)源,做成統(tǒng)一接口。底層支持hbase、mongoDB、HDFS、Cassandra等數(shù)據(jù)源。

它的數(shù)據(jù)接口都是插件化,理論上支持各種查詢語言,SQL自然也不例外,不過目前這個系統(tǒng)還是Apache的一個孵化項目,很多功能尚未完成與穩(wěn)定。但是可以預(yù)見,這個系統(tǒng)如果完成是很有影響力的。下圖為drill的架構(gòu)圖。

(圖片源自:https://cwiki.apache.org/confluence/display/DRILL/High-level+Architecture


Stinger

Hortonworks開源的一個實時類SQL查詢系統(tǒng),也是聲稱可以提升較hive 100倍的速度(悲崔的hive,都拿它來當(dāng)反面教材)。目前處于其計劃中三個階段的最后一個階段。

綜合來看Hortonwork做的事是在hive等分析系統(tǒng)的現(xiàn)有基上加了一個優(yōu)化層,所有的事都要經(jīng)過它的優(yōu)化層Tez(此框架是基于Yarn)來處理,以減少不必要的工作以及資源開銷。雖然它也對HIVE進(jìn)行了很多的優(yōu)化與加強(qiáng),但是這個效果就要看子系統(tǒng)Tez的表現(xiàn)的了。Tez目前也是apache的孵化項目,Stringer如果要穩(wěn)定可以商用依然還有很多路要走。

從下面的示意圖大家可以了解Tez所處的位置。

(圖片源自:http://hortonworks.com/hadoop/tez/

責(zé)任編輯:奔跑的冰淇淋 來源: 開源中國博客
相關(guān)推薦

2012-10-29 09:55:52

HadoopImpalaDremel

2014-07-29 09:19:07

Hadoop

2024-06-19 08:24:47

2013-02-21 16:27:07

開源開源流計算

2010-01-04 13:44:41

SQL

2016-12-23 09:59:27

Linux

2011-09-08 09:24:34

Mac Widget監(jiān)測系統(tǒng)iStatpro

2022-07-14 15:08:21

SQL數(shù)據(jù)驅(qū)動NoSQL

2016-01-06 10:22:18

開源eBayHadoop

2009-11-18 16:16:51

Oracle數(shù)據(jù)庫

2013-10-22 09:36:48

2013-02-22 11:07:36

Red Hat開源Hadoop

2013-12-13 10:24:34

開源SQLHadoop

2015-08-27 15:03:08

Live Query sql2016Livesql2016 調(diào)優(yōu)s

2015-10-08 10:35:47

架構(gòu)師開源實時流處理

2018-06-05 12:06:20

Hadoop開源工具

2017-02-07 09:30:49

TensorFlowHadoop開源

2017-02-06 17:00:09

TensorFlowHadoop開源

2011-08-17 21:23:41

約束NOT NULLUNIQUE

2016-01-08 13:28:00

開源GrafanaZabbix
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: av一二三区 | 欧美日韩中文国产一区发布 | 国产精品一区二区三 | 亚洲午夜精品一区二区三区 | 亚洲精品成人 | 一区二区三区亚洲 | 一区精品在线观看 | 亚洲区一区二 | 99久热在线精品视频观看 | 日本a级大片 | 91精品国产综合久久久密闭 | 亚洲狠狠丁香婷婷综合久久久 | 亚洲成av| 国产资源在线观看 | 91精品国产91久久久久久最新 | 99pao成人国产永久免费视频 | 日韩美女一区二区三区在线观看 | 欧美一区二区三区在线观看 | 日韩久久久一区二区 | 国产精品久久久久久久久久久久久 | 久久99国产精一区二区三区 | 国产精品资源在线 | 亚洲v日韩v综合v精品v | 人人干免费 | 蜜桃官网 | 成人精品在线视频 | 精品无码三级在线观看视频 | 成人毛片视频免费 | 一区在线播放 | 久久机热 | 久久久亚洲精品视频 | 一区二区三区国产视频 | 精品国产欧美在线 | 国产精品视频一区二区三区不卡 | 成人免费一区二区三区视频网站 | 成人久久18免费网站图片 | 手机看片169 | 欧美天堂一区 | 免费影视在线观看 | 欧美日韩国产一区二区三区 | 欧美久久一区二区 |