華為Oceanstor VTL6900集群重刪備份系統介紹
1、背景
隨著企業業務數據的激增,傳統備份方式下,要保存生產數據的多個副本拷貝,導致備份容量會越來越大,造成對備份系統管理困難和成本上升。
然而,備份系統中存在的多個生產數據副本之間,存在著大量的冗余重復數據。因此,對于備份系統,重刪技術的應用可以很好的消除冗余數據,極大節省備份空間,從而降低采購和運維成本。
2、華為OceanStor VTL6900重刪方案
華為集中備份解決方案采用OceanStor VTL6900作為備份設備, VTL6900通過FC SAN或者IP SAN連接備份服務器,應用組網如圖1所示。
圖1 VTL集中備份方案
華為 OceanStor VTL6900虛擬帶庫是業界唯一的集群重刪備份系統,同時支持Post processing和Inline的重復數據刪除技術,其重刪引擎為SIR(Single Instance Repository)。
2.1 Post processing重復數據刪除方案
VTL6900所支持的Post processing重復數據刪除技術,其數據比較方法為索引比較方法。
Post processing重復數據刪除技術原理
在Post processing重復數據刪除模式中,VTL6900軟件包含兩個模塊:VTL模塊和SIR模塊。VTL6900的存儲空間邏輯上被劃分為兩部分,分別為VTL模塊和SIR模塊所用,稱之為VTL存儲空間(又稱為Cache)和SIR存儲空間(又稱為Repository)。VTL6900接收到備份數據后,首先將其存放于VTL存儲空間,此后的某個時刻(如某時間點、備份結束、達到存儲水位等),SIR模塊會讀取這些數據,并將其和SIR存儲空間中的已有不同數據塊進行比較:SIR模塊將原始備份數據劃分為大小為若干KB的數據塊,然后使用SHA-1算法為每個數據塊計算出一個哈希值(又稱為索引/Index),通過比較新數據塊和已有數據塊的哈希值以確定新數據塊是否重復,重復的數據塊將被丟棄,而僅保留其數據塊指針,全新的數據塊才會被存放到SIR存儲空間。
2.2 Inline重復數據刪除方案
VTL6900所支持的Inline重復數據刪除技術,其數據比較方法也為索引比較方法。數據重復數據刪除執行過程,如圖2所示。
Inline重復數據刪除技術原理
在Inline重復數據刪除模式中,VTL6900軟件包含兩個模塊:VTL模塊和SIR模塊。VTL6900在接收到備份數據時,Inline Parser會同步將內存中的原始備份數據劃分為大小為若干KB的數據塊,然后使用SHA-1算法為每個數據塊計算出一個哈希值(又稱為索引/Index)。同時,SIR模塊會在內存中同步的比較新數據塊和已有數據塊的哈希值以確定新數據塊是否重復,重復的數據塊將被丟棄,而僅保留其數據塊指針,全新的數據塊才會被存放到SIR存儲空間。
3、 華為OceanStor VTL6900系統亮點
高性能:滿足用戶對備份窗口的需求。單VTL引擎配置時,VTL6900備份性能可達9TB/hr,8小時內可支持備份63TB數據;雙引擎配置時,VTL6900實測備份性能高達31TB/hr,8小時內可支持備份239TB數據。對于一次備份數據量不超過239TB的用戶,VTL6900可以很好地滿足其對備份窗口的要求。
大容量:滿足用戶對存儲容量的需求。雙VTL引擎配置時,VTL6900***支持1728TB裸容量(可用容量為1230TB),提供重復數據刪除功能時,VTL6900***可提供220TB存儲容量用于存放重復數據刪除后的數據,以20:1重復數據刪除比計算,VTL6900可存放4PB備份數據,滿足中高端用戶對備份容量的需求。
重復數據刪除:極大節約系統能耗和存儲投資。VTL6900支持重復數據刪除和磁盤休眠,可顯著減少備份系統需要配置的磁盤存儲,極大節省系統能耗和存儲投資。
集群架構:滿足用戶高可用需求。雙VTL引擎HA集群配置下,VTL6900的兩個VTL引擎一般都獨立工作,當任何一個VTL引擎出現故障導致其無法支持備份業務時,另一個引擎將自動接管該故障引擎,VTL6900又恢復正常工作,滿足用戶對備份系統的高可用需求。3個(2+1)SIR引擎HA集群配置下,當VTL6900任何一個SIR引擎出現故障導致其無法支持重復數據刪除業務時,Standby SIR引擎將自動接管該故障引擎,VTL6900又恢復正常工作,滿足用戶對備份系統的高可用需求。
4、VTL6900重刪備份系統給客戶帶來的價值
基于重復數據刪除的遠程復制,顯著降低用戶網絡帶寬需求,節約網絡帶寬投資。各個站點的備份數據首先在本地VTL中完成重復數據刪除后,再通過WAN復制到數據中心VTL,復制過程中僅傳輸重復數據刪除后,且在數據中心不存在的那些數據塊,相比直接傳輸未經重復數據刪除的備份數據,此舉可大幅節約復制帶寬,顯著降低用戶網絡帶寬需求,節約網絡帶寬投資。
全局重復數據刪除,進一步降低用戶存儲投資。VTL6900支持全局重復數據刪除功能,即復制過程中僅傳輸重復數據刪除后的、在數據中心不存在的那些數據塊,因此各個分支節點VTL之間的,以及各個分支節點VTL和數據中心VTL之間的重復數據均可得到消除,全局重復數據刪除的重復數據消除效率更高,進一步降低用戶存儲投資。