成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

淺談大數(shù)據(jù)的數(shù)據(jù)災備建設

大數(shù)據(jù)
信息系統(tǒng)的災備,會按照業(yè)務恢復的要求,設置為三級:數(shù)據(jù)級、應用級和業(yè)務級。因業(yè)務級,除了需要IT系統(tǒng)的災備建設,還需要其他非IT資源的配合,所以不在本文討論范圍內。

?一、引言

大數(shù)據(jù)時代,數(shù)據(jù)呈爆炸趨勢增長,很多企業(yè)都從大數(shù)據(jù)中獲得了利益,推動各自的業(yè)務上升了一個臺階。通過大數(shù)據(jù)技術的完善尤其是大數(shù)據(jù)和云容器技術相結合,各個企業(yè)已經把自己的重要業(yè)務遷移到了大數(shù)據(jù)平臺。與此同時企業(yè)對數(shù)據(jù)可靠性和業(yè)務連續(xù)性保證的訴求也與日俱增,大數(shù)據(jù)災備刻不容緩。

信息系統(tǒng)的災備,會按照業(yè)務恢復的要求,設置為三級:數(shù)據(jù)級、應用級和業(yè)務級。因業(yè)務級,除了需要IT系統(tǒng)的災備建設,還需要其他非IT資源的配合,所以不在本文討論范圍內。

二、基礎概念

在討論信息系統(tǒng)災備之前,需要明確兩個概念:RTO和RPO

RTO:(RecoveryTime Object)是指災難發(fā)生后,從IT系統(tǒng)宕機導致業(yè)務停頓之刻開始,到IT系統(tǒng)恢復至可以支持各部門運作,業(yè)務恢復運營之時,此兩點之間的時間段稱為RTO。

RPO:(RecoveryPoint Objective,復原點目標)是指數(shù)據(jù)中心能容忍的最大數(shù)據(jù)丟失量,是指當業(yè)務恢復后,恢復得來的數(shù)據(jù)和災難發(fā)生前數(shù)據(jù)的差異,也就是能夠容忍的數(shù)據(jù)丟失量。

三、大數(shù)據(jù)的數(shù)據(jù)級災備

大數(shù)據(jù)底層數(shù)據(jù)存儲使用HDFS實現(xiàn)。對HDFS的備份,其目的在于當集群A上的數(shù)據(jù)出現(xiàn)問題,可以使用集群B上的數(shù)據(jù)進行恢復。

HDFS在兩個集群間使用distcp命令實現(xiàn)數(shù)據(jù)復制。因distcp命令最終產生的是MR任務,所以可以實現(xiàn)數(shù)據(jù)的并發(fā)拷貝。HDFS中的數(shù)據(jù)的存放,是以目錄的方式進行存放。使用distcp時,需要指定源端集群的目錄和目標端集群目錄。

  • hadoop distcp 
  • hdfs://cluster1/user/app1 
  • hdfs://cluster2/user

如果有多個目標集群,可以在目錄中指定更多的目標集群。在使用distcp命令,也可以增加一些參數(shù),比如使用overwrite覆蓋已有的備份,或者使用update參數(shù)備份修改過的文件。

使用distcp的好處在于備份過程簡單。并且可以根據(jù)自身的需要,對整體集群或對指定的目標進行備份。由于distcp能夠靈活使用,所以非常方便配合各種業(yè)務操作。當每日完成數(shù)據(jù)加工操作后,可以在批量作業(yè)中調用disctcp將重要數(shù)據(jù)備份到異地機房進行保存。

使用此種方法,需要建立目標集群,同時對網絡帶寬有一定需求,所以此種災備系統(tǒng)的成本較高。如果需要降低成本同時對備份和恢復的效率要求不高,也可以將HDFS中的數(shù)據(jù)導出為文本,使用磁帶庫的方式進行備份。

大數(shù)據(jù)平臺中不僅需要對HDFS的數(shù)據(jù)進行備份,HBase數(shù)據(jù)庫的災備也尤為重要。HBase在大數(shù)據(jù)體系中,不僅承載OLAP的業(yè)務,同時也具備OLTP業(yè)務承載能力。

在OLTP業(yè)務場景下,通常對RTO要求較高。可以考慮使用HBase數(shù)據(jù)庫提供的Replication(復制)技術。HBase當前有3種Replication方式:

  • 異步Replication
  • 串行Replication
  • 同步Replication

使用哪一種復制方式,需要根據(jù)對RTO和RPO的要求進行確定。不同種類的復制方式,對于前端業(yè)務在數(shù)據(jù)庫中的操作效率,會有不同的感受。

HBase數(shù)據(jù)庫的備份原理,是對HLog進行讀取并發(fā)給Slave端中進行應用,從而實現(xiàn)數(shù)據(jù)同步。每個Master節(jié)點中的RegionServer都有HLog,開啟HBase的復制方式,在RegionServer上會開啟一個單獨的線程讀取HLog,同時發(fā)送給Slave端。并通過Zookeeper記錄已經發(fā)送的HLog的偏移量。在3種復制方式中,異步的復制方式對源端的HBase影響最小。

圖片

圖1.HBase Replication原理

HBase的Replication是一種較為高級的災備方法。除了使用Replication也可以使用CopyTable、Export/Impor方式進行HBase數(shù)據(jù)庫的數(shù)據(jù)災備。

CopyTable是一種邏輯的數(shù)據(jù)備份技術,其原理是對表的scan操作,對RegionServer會產生較大的壓力,對于OLTP的業(yè)務會有寫入操作的影響。但由于CopyTable的原理是使用HBase的API對表進行scan操作,從而可以讓用戶自定義對表中數(shù)據(jù)抽取,同時目標表的位置可以是本集群或遠端集群。

  • hbase.org.apache.hadoophbase.mapreduce.CopyTable
  • --peer.adr=BkCluster:2181:/hbase 
  • --new.name=BkTable AppTable如果需要備份到本地集群,去掉peer.adr參數(shù)。

HBase的邏輯備份,還可以使用export/import方式。export\import方式不同于CopyTable方法的是,將備份的數(shù)據(jù)以sequence的格式,將數(shù)據(jù)保存到HDFS中。此方法相比于CopyTable在備份和恢復效率方面有所下降,但備份的數(shù)據(jù)可以離線進行長期保留。

  • 數(shù)據(jù)導出方法
  • hbase.org.apache.hadoop.hbase.coprocessor.Export<tablename><outputdir>
  • 數(shù)據(jù)導入方法hbase.org.apache..hadoop.hbase.comprocessor.Import<tablename><inputdir>

CopyTable和export/import兩種方法,都可以靈活的生成備份數(shù)據(jù),配合數(shù)據(jù)加工操作,完成重要數(shù)據(jù)進行備份。但需要考慮在備份過程中對HBase的性能影響。

四、大數(shù)據(jù)的應用級災備

應用級災備,主要對業(yè)務等級較高,對RTO和RPO要求較高的業(yè)務系統(tǒng)而設計的。在大數(shù)據(jù)領域內,完成應用級災備,主要的實現(xiàn)方法是數(shù)據(jù)的雙加載方式。所謂的雙加載方式,是前端應用對部署在不同地點的集群,同時加載數(shù)據(jù)。所有集群都寫入成功后,返回數(shù)據(jù)寫入成功的標志。G行目前采用的是,應用級災備和數(shù)據(jù)級災備的混合模式。聯(lián)機業(yè)務采用應用級災備,聯(lián)機業(yè)務數(shù)據(jù)使用異步批量提交的方法,將數(shù)據(jù)提交給主數(shù)據(jù)集群。主機群通過定時批量的方法,將數(shù)據(jù)分別同步給兩個數(shù)據(jù)查詢集群,前端連接其中一個集群對外提供查詢服務,并在一個查詢集群出現(xiàn)問題時,通過應用程序的手動切換完成數(shù)據(jù)源的隔離,實現(xiàn)數(shù)據(jù)讀操作的切換。此種方式,將讀和寫的操作進行了分離,在寫入操作出現(xiàn)問題時,讀操作任然可用。批量作業(yè)業(yè)務,采用數(shù)據(jù)級容災,對重要數(shù)據(jù)進行數(shù)據(jù)克隆或導出進行保存。

應用級災備是一個系統(tǒng)工程,基礎數(shù)據(jù)層形成了多點保護,相關的應用系統(tǒng)和存儲系統(tǒng)也會改造為多活架構。G行考慮到今后基于大數(shù)據(jù)平臺的聯(lián)機業(yè)務的發(fā)展,將平臺進行了縱向切分,對聯(lián)機業(yè)務單獨建立集群,分離出OLTP業(yè)務,并形成同城兩中心的多活架構。

圖片

圖2.OLTP集群災備

五、后續(xù)與展望

各行各業(yè)基于大數(shù)據(jù)技術在快速發(fā)展自己的業(yè)務,將隨著業(yè)務的變化對大數(shù)據(jù)的災備會提出更多的要求。G行也在根據(jù)自己的業(yè)務,完善大數(shù)據(jù)系統(tǒng)的災備建設,尤其是基于大數(shù)據(jù)的實時業(yè)務的災備建設。我們會將最新的大數(shù)據(jù)災備建設方法,寫在此公眾號上。請關注我們的更新。

責任編輯:武曉燕 來源: 匠心獨運維妙維效
相關推薦

2014-11-25 10:59:21

華為公安大數(shù)據(jù)

2020-02-20 16:34:31

大數(shù)據(jù)安全防護

2022-03-04 06:36:35

數(shù)據(jù)能力數(shù)據(jù)分析

2017-07-11 06:07:59

金融大數(shù)據(jù)互聯(lián)網

2017-10-26 09:22:26

2012-09-06 17:44:22

IBM

2020-12-24 14:10:17

數(shù)據(jù)中心數(shù)據(jù)中心災備災備

2010-01-05 15:56:12

保險公司災備系統(tǒng)

2015-11-18 17:00:15

醫(yī)療大數(shù)據(jù)醫(yī)療信息化

2017-01-18 08:41:22

大數(shù)據(jù)畫像建設

2021-09-23 17:21:19

網易數(shù)據(jù)質量大數(shù)據(jù)平臺

2017-11-22 08:28:22

災備備份數(shù)據(jù)

2023-06-21 18:59:01

2013-12-16 14:16:05

數(shù)據(jù)中心

2019-09-30 11:22:36

浪浪潮商業(yè)機器

2019-10-23 17:07:05

存儲

2022-08-01 11:30:27

數(shù)據(jù)建模

2015-07-03 10:59:19

數(shù)據(jù)中心災備

2010-01-25 11:55:41

MySQL數(shù)據(jù)庫備份數(shù)據(jù)庫安全
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 五月婷六月丁香 | 日韩在线观看网站 | 欧美freesex黑人又粗又大 | 中国美女撒尿txxxxx视频 | 99这里只有精品 | 最新中文字幕在线 | 欧美一区二区三区高清视频 | 日韩欧美网 | 欧美一级片a | 成人a视频片观看免费 | 国产精品亚洲一区 | 亚洲97 | 中文字幕av中文字幕 | 国产精品久久久久久久久久99 | 精品福利一区二区三区 | 亚洲一区二区久久 | 国产精品99久久久精品免费观看 | 国产视频不卡一区 | 免费在线观看成人av | 国产伦精品一区二区 | 国产精品夜夜夜一区二区三区尤 | 欧美色综合一区二区三区 | 羞羞视频网站免费观看 | 97国产一区二区精品久久呦 | 99精品国产在热久久 | 国产情侣激情 | 久久精品久久久久久 | 欧美日韩电影一区 | 国产一区视频在线 | 国产免费拔擦拔擦8x高清 | 久久久久久91香蕉国产 | 欧美爱爱视频网站 | 暖暖成人免费视频 | 一区二区高清 | 国产成人区| 欧美激情在线观看一区二区三区 | 青青草综合 | 狠狠操狠狠操 | 狠狠亚洲| 国产免费一区二区 | 亚洲视频 欧美视频 |