成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

基于Hadoop生態(tài)系統(tǒng)的一高性能數(shù)據(jù)存儲格式CarbonData(性能篇)

存儲 存儲軟件 Hadoop
CarbonData在數(shù)據(jù)查詢的性能表現(xiàn)比Parquet好很多,在寫一次讀多次的場景下非常適合使用;社區(qū)比較活躍,響應也很及時。目前官網(wǎng)發(fā)布版本1.3.0與最新的spark穩(wěn)定版Spark2.2.1集成,增加了支持標準的Hive分區(qū),支持流數(shù)據(jù)準實時入庫等新特性,相信會有越來越多的項目會使用到。加米谷大數(shù)據(jù)轉給大家參考學習。

[[264630]]

 CarbonData在數(shù)據(jù)查詢的性能表現(xiàn)比Parquet好很多,在寫一次讀多次的場景下非常適合使用;社區(qū)比較活躍,響應也很及時。目前官網(wǎng)發(fā)布版本1.3.0與***的spark穩(wěn)定版Spark2.2.1集成,增加了支持標準的Hive分區(qū),支持流數(shù)據(jù)準實時入庫等新特性,相信會有越來越多的項目會使用到。

一、評測環(huán)境

1)網(wǎng)絡拓撲圖

基于Hadoop生態(tài)系統(tǒng)的一高性能數(shù)據(jù)存儲格式CarbonData(性能篇)

2)配置參數(shù)

Ø 服務器配置

基于Hadoop生態(tài)系統(tǒng)的一高性能數(shù)據(jù)存儲格式CarbonData(性能篇)

二、性能對比

目前主流hadoop的文件存儲格式有行存儲的CSV格式,列式存儲的ORC和Parquet等。本章給出的是Parquet+Spark和CarbonData+Spark在過濾查詢場景和聚合計算場景的性能測試結果。

1)測試數(shù)據(jù)

創(chuàng)建沈陽社保的數(shù)據(jù)倉庫,導入、集成1年的測試數(shù)據(jù),如下表:

基于Hadoop生態(tài)系統(tǒng)的一高性能數(shù)據(jù)存儲格式CarbonData(性能篇)

生成CarbonData格式文件,如下表:

基于Hadoop生態(tài)系統(tǒng)的一高性能數(shù)據(jù)存儲格式CarbonData(性能篇)

2)過濾查詢場景測試

基于Hadoop生態(tài)系統(tǒng)的一高性能數(shù)據(jù)存儲格式CarbonData(性能篇)

基于Hadoop生態(tài)系統(tǒng)的一高性能數(shù)據(jù)存儲格式CarbonData(性能篇)

Parquet和CarbonData在過濾查詢場景下的性能對比

3)聚合計算場景測試

Parquet和CarbonData在聚合計算場景下的性能對比

4)總結分析

在過濾查詢中,CarbonData的查詢效率比parquet效率好,主要體現(xiàn)在列數(shù)據(jù)的索引查詢,極大地提高了精確查詢的性能。在聚合查詢中,CarbonData通過使用全局字典編碼來加快計算速度,這使得處理、查詢引擎可以直接在編碼好的數(shù)據(jù)上進行處理而不需要轉換數(shù)據(jù),數(shù)據(jù)只有在返回結果給用戶的時候才轉換成用戶可讀的形式,通過索引有效過濾文件數(shù)據(jù)塊減少磁盤的IO,提高查詢性能。

基于Hadoop生態(tài)系統(tǒng)的一高性能數(shù)據(jù)存儲格式CarbonData(性能篇)

三、小結

CarbonData在數(shù)據(jù)查詢的性能表現(xiàn)比Parquet好很多,在寫一次讀多次的場景下非常適合使用;社區(qū)比較活躍,響應也很及時。目前官網(wǎng)發(fā)布版本1.3.0與***的spark穩(wěn)定版Spark2.2.1集成,增加了支持標準的Hive分區(qū),支持流數(shù)據(jù)準實時入庫等新特性,相信會有越來越多的項目會使用到。

責任編輯:武曉燕 來源: 今日頭條
相關推薦

2018-07-03 08:33:04

Hadoop存儲CarbonData

2017-06-15 10:21:30

Apache Hado存儲引擎性能

2016-12-20 16:40:13

CarbonData數(shù)據(jù)存儲大數(shù)據(jù)

2017-01-05 09:48:51

大數(shù)據(jù)數(shù)據(jù)格式生態(tài)

2023-03-29 11:11:42

2013-11-04 16:57:21

Hadoop大數(shù)據(jù)Hadoop生態(tài)系統(tǒng)

2022-01-06 18:21:00

Hadoop生態(tài)系統(tǒng)

2011-04-26 10:08:47

Linux存儲生態(tài)環(huán)境

2011-12-09 11:02:52

NoSQL

2021-11-23 20:54:34

AI 生態(tài)系統(tǒng)

2015-06-08 12:44:58

大數(shù)據(jù)InterlAMPCamp

2013-05-27 10:01:33

HadoopHadoop系統(tǒng)

2018-03-19 15:17:37

Hadoop大數(shù)據(jù)數(shù)據(jù)

2019-01-13 15:00:52

區(qū)塊鏈生態(tài)系統(tǒng)

2009-12-25 14:49:55

2015-04-01 11:23:23

2011-05-19 15:15:39

Oracle生態(tài)系統(tǒng)

2012-04-25 10:52:30

生態(tài)系統(tǒng)AppleGoogle

2010-05-12 11:16:00

SAP

2022-06-08 14:49:32

F5NGINXAzure
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲美女一区 | 欧美狠狠操 | 99视频在线播放 | 精品欧美乱码久久久久久1区2区 | 看片91| 爱爱视频在线观看 | 欧美精品一区二区在线观看 | 国产免国产免费 | 亚洲成人免费视频 | 中文字幕 国产 | 日韩精品成人在线 | 国产精品一区一区三区 | 操久久 | 97久久精品午夜一区二区 | 国产亚洲一区精品 | 亚洲精品9999久久久久 | 国产精品成人一区二区三区夜夜夜 | 国产在线小视频 | 玖玖视频网 | 黄色激情毛片 | 久久国产综合 | 精品人伦一区二区三区蜜桃网站 | 久久久精品一区二区三区 | 97色在线视频 | 国产成人免费视频网站高清观看视频 | 亚洲成人日韩 | 午夜精品视频在线观看 | 操人视频在线观看 | 成人h视频 | 国产精品日本一区二区不卡视频 | 精品国产欧美一区二区三区成人 | 99久久婷婷国产综合精品电影 | 国产精品久久在线 | 久久99久久98精品免观看软件 | jizz亚洲人 | 在线免费观看a级片 | 四虎网站在线观看 | 国产精品欧美一区喷水 | 日韩二区三区 | 成人在线免费观看视频 | 高清国产一区二区 |