成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

異構(gòu)跨庫數(shù)據(jù)同步還在用Datax?來看看這幾個(gè)開源的同步方案

數(shù)據(jù)庫 其他數(shù)據(jù)庫
目前,異構(gòu)數(shù)據(jù)ETL同步,一般基于兩種方式:查詢和日志,基于查詢做全量同步,基于日志做增量同步,日志方式延遲會(huì)比較小,查詢來做增量,延遲會(huì)比較大,查詢頻率越高,對(duì)數(shù)據(jù)庫性能也會(huì)有影響。

在遇到跨庫或者異庫數(shù)據(jù)同步時(shí),我們一般都會(huì)借助ETL工具來實(shí)現(xiàn)數(shù)據(jù)同步功能。比如目前大家較為熟知的Kettle和Datax。但是,這兩個(gè)需要定時(shí)去查詢數(shù)據(jù)庫的數(shù)據(jù),會(huì)存在一定的延遲,而且,默認(rèn)采用全量同步的方式,想要增量,需要自己做特殊的處理。那么,有沒有開源的工具,既能滿足全量和增量,又能達(dá)到相對(duì)比較實(shí)時(shí)的呢?接下來,我們繼續(xù)往下看。

Kettle

在ETL行列中,kettle算是人氣比較旺的一款工具,功能多且強(qiáng)大,開源,可視化。使用方便、簡(jiǎn)潔,但是,體量越來越大,性能一般。

可以自己下載源碼編譯,要求Maven 3+Java JDK 11

??https://github.com/pentaho/pentaho-kettle.git??

DataX

DataX 是阿里云 DataWorks數(shù)據(jù)集成 的開源版本,在阿里巴巴集團(tuán)內(nèi)被廣泛使用的離線數(shù)據(jù)同步工具/平臺(tái)。DataX 實(shí)現(xiàn)了包括 MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、Hologres、DRDS, databend 等各種異構(gòu)數(shù)據(jù)源之間高效的數(shù)據(jù)同步功能。

類型

數(shù)據(jù)源

Reader(讀)

Writer(寫)

文檔

RDBMS 關(guān)系型數(shù)據(jù)庫

MySQL

讀 、寫


Oracle

讀 、寫


OceanBase

讀 、寫


SQLServer

讀 、寫


PostgreSQL

讀 、寫


DRDS

讀 、寫


Kingbase

讀 、寫


通用RDBMS(支持所有關(guān)系型數(shù)據(jù)庫)

讀 、寫

阿里云數(shù)倉(cāng)數(shù)據(jù)存儲(chǔ)

ODPS

讀 、寫


ADB



ADS



OSS

讀 、寫


OCS



Hologres



AnalyticDB For PostgreSQL


阿里云中間件

datahub

讀 、寫


SLS

讀 、寫

阿里云圖數(shù)據(jù)庫

GDB

讀 、寫

NoSQL數(shù)據(jù)存儲(chǔ)

OTS

讀 、寫


Hbase0.94

讀 、寫


Hbase1.1

讀 、寫


Phoenix4.x

讀 、寫


Phoenix5.x

讀 、寫


MongoDB

讀 、寫


Cassandra

讀 、寫

數(shù)倉(cāng)數(shù)據(jù)存儲(chǔ)

StarRocks

讀 、寫


ApacheDoris



ClickHouse



Databend



Hive

讀 、寫


kudu


無結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)

TxtFile

讀 、寫


FTP

讀 、寫


HDFS

讀 、寫


Elasticsearch


時(shí)間序列數(shù)據(jù)庫

OpenTSDB



TSDB

讀 、寫


TDengine

讀 、寫

??https://github.com/alibaba/DataX.git??

DataX-Web

前面提到DataX,那么就不得不提一下DataX-Web,DataX沒有可視化界面,不過目前,已經(jīng)有熱心開基于DataX開發(fā)了對(duì)應(yīng)的Web界面。DataX Web是在DataX之上開發(fā)的分布式數(shù)據(jù)同步工具,提供簡(jiǎn)單易用的 操作界面,降低用戶使用DataX的學(xué)習(xí)成本,縮短任務(wù)配置時(shí)間,避免配置過程中出錯(cuò)。用戶可通過頁面選擇數(shù)據(jù)源即可創(chuàng)建數(shù)據(jù)同步任務(wù),支持RDBMS、Hive、HBase、ClickHouse、MongoDB等數(shù)據(jù)源,RDBMS數(shù)據(jù)源可批量創(chuàng)建數(shù)據(jù)同步任務(wù),支持實(shí)時(shí)查看數(shù)據(jù)同步進(jìn)度及日志并提供終止同步功能,集成并二次開發(fā)xxl-job可根據(jù)時(shí)間、自增主鍵增量同步數(shù)據(jù)。

任務(wù)”執(zhí)行器”支持集群部署,支持執(zhí)行器多節(jié)點(diǎn)路由策略選擇,支持超時(shí)控制、失敗重試、失敗告警、任務(wù)依賴,執(zhí)行器CPU.內(nèi)存.負(fù)載的監(jiān)控等等。后續(xù)還將提供更多的數(shù)據(jù)源支持、數(shù)據(jù)轉(zhuǎn)換UDF、表結(jié)構(gòu)同步、數(shù)據(jù)同步血緣等更為復(fù)雜的業(yè)務(wù)場(chǎng)景。

??https://github.com/WeiYe-Jing/datax-web.git??

Airbyte

一款開源的可視化ETL功能,支持很多數(shù)據(jù)源,并且支持全量及增量同步。

??https://github.com/airbytehq/airbyte.git??

benthos

Benthos 是一個(gè)開源的、高性能和彈性的數(shù)據(jù)流處理器,支持多種方式的數(shù)據(jù)接入、加工、轉(zhuǎn)換。

??https://github.com/benthosdev/benthos.git??

canal

阿里巴巴開源的MySQL binlog 增量訂閱&消費(fèi)組件,基于日志只能做增量同步,很多工作需要自己處理。

??https://github.com/alibaba/canal.git??

Maxwell

也是監(jiān)聽MySQL binlog,并將數(shù)據(jù)更解析為JSON寫入到Kafka等其他流媒體平臺(tái)。

??https://github.com/zendesk/maxwell.git??

debezium

Debezium是一個(gè)捕獲數(shù)據(jù)更改(CDC)平臺(tái),并且利用Kafka和Kafka Connect實(shí)現(xiàn)了自己的持久性、可靠性和容錯(cuò)性。每一個(gè)部署在Kafka Connect分布式的、可擴(kuò)展的、容錯(cuò)性的服務(wù)中的connector監(jiān)控一個(gè)上游數(shù)據(jù)庫服務(wù)器,捕獲所有的數(shù)據(jù)庫更改,然后記錄到一個(gè)或者多個(gè)Kafka topic(通常一個(gè)數(shù)據(jù)庫表對(duì)應(yīng)一個(gè)kafka topic)。Kafka確保所有這些數(shù)據(jù)更改事件都能夠多副本并且總體上有序(Kafka只能保證一個(gè)topic的單個(gè)分區(qū)內(nèi)有序),這樣,更多的客戶端可以獨(dú)立消費(fèi)同樣的數(shù)據(jù)更改事件而對(duì)上游數(shù)據(jù)庫系統(tǒng)造成的影響降到很小(如果N個(gè)應(yīng)用都直接去監(jiān)控?cái)?shù)據(jù)庫更改,對(duì)數(shù)據(jù)庫的壓力為N,而用debezium匯報(bào)數(shù)據(jù)庫更改事件到kafka,所有的應(yīng)用都去消費(fèi)kafka中的消息,可以把對(duì)數(shù)據(jù)庫的壓力降到1)。另外,客戶端可以隨時(shí)停止消費(fèi),然后重啟,從上次停止消費(fèi)的地方接著消費(fèi)。每個(gè)客戶端可以自行決定他們是否需要exactly-once或者at-least-once消息交付語義保證,并且所有的數(shù)據(jù)庫或者表的更改事件是按照上游數(shù)據(jù)庫發(fā)生的順序被交付的。

??https://github.com/debezium/debezium.git??

Flink CDC

Apache Flink?的CDC連接器集成了Debezium作為捕獲數(shù)據(jù)更改的引擎。雖然功能強(qiáng)大,但是比較重。

??https://github.com/ververica/flink-cdc-connectors.git??

目前,異構(gòu)數(shù)據(jù)ETL同步,一般基于兩種方式:查詢和日志,基于查詢做全量同步,基于日志做增量同步,日志方式延遲會(huì)比較小,查詢來做增量,延遲會(huì)比較大,查詢頻率越高,對(duì)數(shù)據(jù)庫性能也會(huì)有影響。隨著各種熱門技術(shù)的興起,在Github中也有越來越多的解決方案,我們可以根據(jù)自己的實(shí)際情況選擇合適自己的工具。

責(zé)任編輯:武曉燕 來源: 今日頭條
相關(guān)推薦

2024-06-03 00:00:06

高性能數(shù)據(jù)傳輸應(yīng)用程序

2021-02-18 14:03:19

Linux命令行history

2021-06-10 10:33:22

Jenkins持續(xù)集成工具自動(dòng)化

2009-03-24 13:29:03

XML報(bào)文數(shù)據(jù)交換

2023-05-03 08:58:46

數(shù)據(jù)庫開源

2020-09-21 09:00:41

Docker架構(gòu)容器

2024-02-04 08:05:48

DataX阿里云開源

2022-02-23 14:18:53

If-Else入?yún)?/a>接口

2020-02-28 16:02:21

MySQL異構(gòu)同步

2021-08-10 23:09:55

區(qū)塊鏈數(shù)據(jù)技術(shù)

2016-08-21 14:19:05

數(shù)據(jù)工具DataXSqoop

2023-10-30 08:18:21

內(nèi)存泄漏Java

2021-04-14 15:15:46

開源技術(shù) 工具

2023-04-18 18:22:31

開源工具數(shù)據(jù)庫

2010-07-22 11:17:52

SQL Server數(shù)

2020-12-21 09:40:16

數(shù)據(jù)庫工具技術(shù)

2010-07-02 08:39:02

SQLServer數(shù)據(jù)

2020-03-06 10:54:51

Go語言XML算法

2020-08-31 07:00:00

數(shù)據(jù)庫數(shù)據(jù)庫同步

2018-06-19 16:25:40

編程語言Python爬蟲
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 亚洲国产激情 | 中文福利视频 | 亚洲狠狠爱 | 视频一区中文字幕 | 日本一区二区三区四区 | 韩日免费视频 | 精品在线看 | 国产日韩久久 | 影音av| 韩日av在线| 亚洲综合在线一区 | 91久久综合 | 91精品国产综合久久婷婷香蕉 | 久草免费在线视频 | 亚洲精品免费观看 | 久久久91精品国产一区二区三区 | 国产日韩欧美一区二区 | 欧洲视频一区二区 | 国产乱码精品1区2区3区 | 国产欧美在线视频 | 成人午夜电影网 | 黑人性hd | 一区二区三区亚洲视频 | h片在线免费观看 | 中文字幕一区二区三区四区 | 国产精品色 | 亚洲美女在线视频 | 色综合99| 99精品欧美一区二区三区综合在线 | 欧美日韩成人一区二区 | 日韩久久久久久 | 国产激情视频在线观看 | 日日日日日日bbbbb视频 | 欧美日韩国产高清视频 | 99re6在线视频精品免费 | а天堂中文最新一区二区三区 | 56pao在线 | 午夜久久久久久久久久一区二区 | 国产精品视频一二三区 | 成人午夜看片 | 成人黄页在线观看 |