深信服容災網絡優化方案
Gartner Group發布了一份報告,揭示了數據丟失風險的嚴重性:在經歷了數據完全丟失而導致系統停運的企業中,有2/5再也沒能恢復運營,余下的企業也有1/3在兩年內宣告破產。也就是說,六成企業因數據完全丟失而倒閉。為保障數據的安全性,容災建設必不可少,各種異地災備中心、同城災備中心,都在如火如荼的建設中。
在災備建設中往往需要考慮兩個指標:RTO、RPO。在數據中心和災備中心網絡中,我們往往已采用高性能的災備系統以及千兆甚至萬兆網絡,從端點上為災備運轉高效打下了良好的基礎。但是在真正進行災備數據傳輸時,卻遭遇到了以下幾種尷尬場景:
畫面一:每日需傳輸的災備數據量大,以百G來計,但從主數據中心的到災備中心的專線只有僅僅10Mbps,數據無法在指定時間內完成傳輸。隨著業務的不斷增多,數據滯后也越來越多,數據的丟失風險也不斷攀升,RPO難保證……
畫面二:多數據中心拉了1Gbps的公網帶寬進行實時遠程復制或災備數據傳輸,但受到公網丟包延時的限制,尤其在跨運營商情況下,雖然帶寬高達1G,但數據傳輸速度一直上不去,效率受到了大大制約……
畫面三,主數據中心和災備中心之間通過1Gbps的專線互聯,延時只有25ms,網絡帶寬足質量好,但是災備系統在運作時,速度極限只能跑到尷尬的180Mbps,徒有大帶寬卻白白浪費,RTO不達標……
以上場景都體現了一個問題,在高性能的災備系統和局域網絡面前,廣域網絡成為了整個災備運轉的瓶頸。需要獲得高效率災備及數據恢復,就需要解決容災網絡效率低下的問題。
那該如何解決?
深信服WOC容災網絡優化方案給出了很好的答案。
針對場景一,主要是數據量大與窄帶寬之間的矛盾。深信服WOC容災網絡優化方案采高細粒度冗余數據消除技術解決,無損數據削減的方式,減少網絡中需要傳輸容災數據總量,在有限的帶寬內實現高效的傳輸,從而提升災備速率。數據削減采用的技術為基于碼流特征的數據優化技術,以及無損數據流壓縮技術,實現bit級重復數據刪除,災備需傳輸流量可達到60%-90%的削減。
某檢驗檢疫局,主數據中心在省會城市A,并在地市局B建立災備中心,A到B之間只有4Mbps的專線互聯,每日災備數據需要從晚上完成到A到B的傳輸。但由于數據量大,往往在規定的備份時間窗口之內無法完成傳輸,需要到第二天中午才把災備數據傳輸完。而災備數據和業務鏈路為共用專線,導致第二天上網B局人員訪問業務系統速度非常慢。通過深信服WOC容災網絡優化方案對災備傳輸進行優化,原有需要傳輸整晚甚至到第二天中午才傳完的數據,部署后兩三個小時既已完成災備數據的傳輸,加快了災備效率,降低數據災難風險。
針對場景二,災備效率的瓶頸主要在網絡的質量上。在丟包存在、延時較高的情況下,網絡實際吞吐性能將大打折扣;同時,災備需傳輸的數據量大,也是耗時長、RTO不達標的一個原因。針對這個問題,深信服WOC容災網絡優化提出鏈路質量優化+無損數據削減的方案解決。針對公網線路,尤其跨運營商線路中的丟包延時問題,通過鏈路質量優化功能,采用改進性的HTP算法優化TCP協議,在丟包延時環境下大大提升網絡的吞吐性能;并通過基于碼流特征的數據優化技術,以及無損數據流壓縮技術,大大消除災備需傳輸的數據量,提升帶寬吞吐、削減傳輸數據量,從而實現災備網絡的加速。
某媒體集團,主數據中心在北京,災備中心在廣州,出口分別電信和聯通的公網線路,主要傳輸的數據類型為音視頻數據。由于受到跨運營商的影響,原有NetApp 災備系統受到網絡影響比較嚴重,傳輸速度平均為6Mbps,峰值只有10Mbps。通過深信服WOC容災網絡優化方案的部署,解決網絡質量問題,傳輸速度從6Mbps一下提高到了50Mbps,網絡性能得到顯著的提高。
針對場景三,主要是因為TCP本身的制約導致傳輸速度受限。在一對災備系統之間,往往是通過單TCP連接或是僅幾條TCP連接相連,而TCP本身因為受到傳輸窗口等協議本身的限制,速度存在上限值。傳統的TCP協議傳輸窗口為64KB,在網絡延時為20ms時,單條TCP連接吞吐僅為25Mbps。雖然許多災備系統基于Unix開發,對TCP協議進行了一部分優化,但相對于1Gbps這樣的大帶寬,吞吐還是出于160Mbps-200Mbps這樣的低位,無法完全利用帶寬保障RTO。
針對TCP本身的低效性,深信服WOC災備優化方案通過TCP協議優化+無損冗余數據削減功能,可大大提升整個網絡的吞吐。在某金融機構實際測試中,對于一對災備設備之間的廣域網傳輸,性能從160Mbps大幅提升至600Mbps,并可擴展提升至2.5Gbps,滿足大帶寬災備需求。