淺談云環境下的數據保護策略
企業核心數據是企業的命脈。通過建立完善的數據保護系統,保障核心數據已經成為當前眾多企業的共識。為防止IT系統最重要的資產——數據的丟失,越來越多的企業開始從信息系統的安全性、穩定性和可靠性出發,以數據安全為目標,構建自己的數據保護體系。然而,隨著云計算的普及和大數據時代的來臨,急速膨脹的數據量使企業在數據保護方面投入的硬件以及人力、時間成本劇增。如何不讓數據保護方案成為企業業務走向“巔峰”的攔路虎,是困擾大多數IT管理人員的難題。其中,解決成本難題與降低管理風險便是首要考慮的重點。
重復數據刪除 讓存儲系統成功瘦身
在如今這個數據爆炸時代,我們的數據量究竟有多大?據知名調研機構IDC給出的預測稱,到2020年,全球數據量將達到驚人的40 ZB,數據規模將達到今天的44倍。除了數據和信息存儲量的持續增加,云環境下的企業數據保護體系還面臨:
-------有限的預算
-------數據有著較長的生命周期,這意味著會有更多數據需要保存得更久。
海量數據帶來的問題不僅僅是存儲本身,處于數據價值和法規性要求,這些數據通常還要保留一定的年限,比如一些數據通常要求保留數個月甚至數年。這些數據通常不會都存儲在生產系統里面,而是需要轉存到備份系統甚至歸檔系統。
-------對數據和應用的威脅在不斷發展,7*24小時的業務連續性需求迫使企業的備份和數據保護計劃也隨之改變。
面對有限的預算和海量的數據,如何最大限度地減少企業存儲和保護的數據量是IT管理人員的重中之重。讓企業進行存儲“瘦身”的意義是什么?舉例來說,假如一個企業最多可以承受35 ZB的數據量,那么當這個數據量減少至7 ZB時,數據存儲成本會大幅降低80,企業眾多的IT項目預算也將不再望塵莫及。重復數據刪除技術便能讓這種意義重大的轉變成為現實。作為企業用戶廣泛采用的數據縮減技術之一,重復數據刪除可以從根本上減少存儲占用的空間和用戶的磁盤驅動器數量,減輕人力、能源、電力資源等方面的開銷,從而大幅度的節約存儲成本。另外,重復數據刪除可以減少在網絡中傳輸的數據量,進而降低能量消耗和網絡成本,并為數據復制大量節省網絡帶寬。除了節約成本,重復數據刪除技術還可提升數據保護體系的性能、增加每秒I/O操作,并通過消除多余和不必要的數據來提高了存儲的利用率。
而在支持云計算環境和虛擬化方面,重復數據刪除技術同樣也是不可或缺的要素。在虛擬化和云計算中,靈活性和性能的需求是存儲決策的主要驅動力。基于企業的業務需求,重復數據刪除可以為企業提供足夠的靈活性,并對每個站點的數據容量進行相應的調整。出色的市場表現也證明了這一點,據最新研究顯示,預計2011年至2015年重復數據刪除技術的全球市場將以年復合增長率30%以上的速度增長。

▲戴爾DR4100
作為在數據中心技術方面處于領先地位的IT解決方案提供商,戴爾在數據保護產品上也秉承了其一貫以來的創新改革理念,通過不斷推出創新的解決方案來引領市場的發展,DR4000存儲平臺便是其首款主打重復數據刪除的備份產品。而在今年二月,戴爾更是推出了DR4000的升級版DR4100。據悉,DR4100是戴爾專為解決客戶的痛點(包括備份窗口限制、還原緩慢及災難恢復不可靠且緩慢等)而設計,不僅擁有磁盤備份解決方案的性能和可靠性,還添加了戴爾通過收購Ocarina Networks公司而獲得的重復數據刪除和壓縮能力。在DR4100中,戴爾選擇了塊級的重復數據刪除方式。相對于文件級重復數據刪除技術,塊級重復數據刪除可以提供更小的顆粒度,并且能提供次文件級的重復數據刪除功能,可為用戶帶來更高的重復數據刪除率。
分層保護戰略 冷熱數據各司其職
隨著云計算、虛擬化等技術的興起,企業的IT基礎架構也隨之發生了變化。下一代數據中心的發展逐漸從物理轉為虛擬,現正步入云時代。然而,云環境下存儲系統的存儲容量不但通常都高達PB級別,同時還需具備強大的擴展能力。這樣在同種存儲類型中就存在提供同種訪問類型,但是不同訪問能力的需求。
按照信息生命周期管理原理,我們把數據分成五個層次:應用層、生產層、恢復層、保護層和歸檔層。數據在應用層產生,首先被存放在生產層,恢復層是為了快速恢復生產數據而設立的,保護層就是存放傳統的備份數據,歸檔層是存放歸檔數據的。通常在生產層產生一份數據,那么在恢復層會產生3-5倍的數據,在保護層會產生6-10倍的數據,而在歸檔層則是25-50倍的數據。企業要同時管理不同層次的數據,并要確保數據能在不同層次之間快速傳送。
正如上文所提到的,同種訪問類型的數據需要不同的訪問能力。這也意味著,在企業中,并非所有的數據都需要同等級別的保護。有些數據需要特定的數據設置,包括備份頻率,備份量(全部還是部分備份),副本數量以及數據保存在哪里,保存多久時間。如果所有數據的保護都大同小異是行不通的,這意味著企業的有些數據資產保護不足,而另外一些則保護過度。對不需要保護的數據過度配置資源,卻對某些數據保護不足,這會從許多不同的方面為企業帶來大量成本。
顯然企業也逐漸意識到了數據的價值并非全都一樣,也不是一成不變的。戴爾亞太區存儲業務部技術總監許良謀表示,現在的企業用戶對不同級別的數據(冷熱數據)的有效處理和存儲愈發重視。因此,數據保護體系也需要更好地對冷熱數據存儲有著更為智能的策略。分層存儲技術的初衷便是出于這樣的考慮,它可將價值最大的數據保存在等級最高的存儲資源上,以保證最高的性能、可用性和安全性。而對不重要的數據,就放在代價最小的存儲資源上,這樣就可減輕主存的容量壓力,提高響應的速度。
采用分層存儲的方式后,企業用戶可以按照冷熱數據的使用率,把它們放在最正確最適當的地方。而且隨著數據的增加,企業對于數據歸檔的需求也日益提升。在沒有分層存儲能力的時代,歸檔的實現相當困難,尤其是對于結構化的數據。不過在應用了分層存儲技術之后,歸檔就變得簡單多了。系統可以自動在后臺實現數據的歸檔,并根據數據的重要性以及訪問的需求在不同的存儲層中進行遷移,這樣的實現對于應用系統是完全透明的。從應用的角度來看,分層存儲也將云計算最大的優勢——“高效和靈活”體現的淋漓盡致。
可以說,IT系統的成敗將直接決定企業業務的成敗,而在IT系統中,數據保護是其中的關鍵。雖然一直以來數據保護總被視為“云計算”廣泛應用的絆腳石,但新一代數據保護策略針對云和海量數據環境在技術上進行了改進,通過結合不斷變化的IT環境特點,對所遇到的數據保護問題做出合理的應對,從云的“絆腳石”轉化為“推動力量“。在云計算模式下,采用合理的數據保護方法,可以將“云”模式所帶來的商業潛力最大化,使云真正成為企業可持續發展的源動力。