怎樣更科學的進行數據備份管理中的分類定級?
1. 數據備份管理工作中的四類難題
數據是企業最重要的數字資產,主要包括企業業務經營所依賴的信息系統所產生的各種業務數據以及支撐信息系統運行的程序、配置數據、日志、操作系統等其他數據。數據備份是數據保護的最后一道防線,可有效抵御外部黑客攻擊、內部人員誤操作以及各種軟硬件故障導致的數據丟失風險,很大程度上保證了數據的完整性和可用性。
由于金融行業對數據的敏感性,重要的業務數據往往需要滿足長時間保存、備查的要求。因此,數據備份工作不僅僅關系到企業的業務連續性,還需要滿足國家法律、監管機構的合規要求。以筆者所在中小保險公司為例,目前在數據備份管理工作中,普遍存在著以下四類運維管理要素的難題:
1)人員要素問題
在運維管理體系中,人員的管理是第一要素,數據備份工作也不例外。一般來說,公司的研發或業務人員應該根據內外部監管和業務連續性需求提出不同業務系統的數據備份策略,是數據備份的需求提出方;而運維人員按照數據備份策略的需求建立數據備份系統及運維流程,扮演著數據備份的執行和管理角色。由于不同的業務系統對應著不同的需求提出方,備份管理人員不能很好地獲取準確的備份需求,會存在很高的溝通成本問題。
2)資源要素問題
數據備份管理需要建設一套完整的系統,包括備份管理系統、備份存儲設備、備份介質等,并定期對數據中心的數據進行轉儲備份。如果只投入較少的資源,導致數據備份不能有效覆蓋,在緊急情況下需要采用數據恢復手段、而數據備份又無法提供有效支持時,這是這種嚴重失職;而為了數據備份能有效覆蓋,采取投入過多備份資源的手段,又會增加數據備份管理成本。
3)技術要素問題
數字化轉型的沖擊下,數據備份工作不能只關注于傳統數據庫的備份,而數據量更加龐大的非結構化數據也不容忽視,需要結合實際工作需要,制定完善備份方案。
4)過程要素問題
在運維過程管理中,最突出的是沒有體現涉及數據備份的需求方和管理執行方的配置管理、變更管理、容量管理等過程。在大多數運維實踐中,數據備份管理往往成了 IT 運維部門單方面的工作。
2. 如何應對
隨著業務范圍、業務渠道、業務內容的變化,企業的 IT 系統數量迅速增加,出現了各種類型的業務系統,必然需要不同的數據備份策略。數據備份策略既不能簡單的采用一刀切的方式,也不能過于復雜。一刀切的方式雖然簡單,但往往需要投入更多的資源才能有效覆蓋,實踐過程中也會有諸多技術難點需要解決;而過于復雜的策略會增加運維管理成本,也沒有有效解決溝通成本的問題。
數據備份管理的溝通成本問題,關鍵還是需要建立高效的數據備份策略標準。企業往往已經建立了 IT 系統災難恢復等級體系,結合業務連續性的需求,將不同的 IT 系統劃分為不同災難恢復等級,并采用不同的災備恢復方案。數據備份管理一般可參照 IT 系統的災難恢復等級分類來定級,制定不同的數據恢復方案。
這種基于信息系統的分類定級方法是高效的,比如對于保險行業來說,包含承保、理賠等業務功能的核心系統、財務系統、投資系統是最關鍵的業務系統,必然需要高級別的數據保護策略。但是信息系統本身是復雜的,信息系統上的數據更是多樣的,基于信息系統的分類定級是從業務連續性出發,并不是數據管理層面最科學的方法。例如在某些 IT 系統的非結構化數據中,既大量存在著低價值信息,也存在一些敏感數據或高價值數據。數據備份策略還是需要從數據層面分析其可用性和完整性需求,來制定分類定級的備份策略,主要基于以下兩方面的需求 :
1)滿足合規需求。 近年來,《數據安全法》、《個人信息保護法》等國家層面的數據安全領域的法律法規陸續出臺,數據備份管理與數據安全、數據保護息息相關,需要從數據層面去優化 IT 運維管理;
2)滿足企業自身運營要求。 隨著企業信息化治理水平的提高,數據資產化理念逐漸深入,精細化的數據管理對數據備份策略提出了更高的要求。
3. 數據備份的分類定級策略
數據分類強調的是根據數據種類的不同,依照數據的屬性、特征而進行的劃分;定級則側重于按照特定的一些評價標準,對同類型的數據制定相應的數據備份保護級別;最后是綜合運用不同的數據備份的技術手段來實現數據備份策略的分類定級。
3.1 數據分類方法
數據可以從多個維度去分類,不同的分類維度會產生不同數據歸類結果,為了統一數據分類結果,一般采用多級分類的方法。數據分類維度也不宜過細,要考慮數據備份的實際顆粒度。
以業務系統一般作為一級子類,該分類比較明確,分別對應于不同的業務系統;電子數據的存在形式主要包括數據庫等結構化數據與非結構化數據這兩種類型,作為二級子類,該分類也比較明確;再按照數據來源進行分類補充,可分為客戶數據、業務數據、運營管理數據以及辦公數據,作為三級子類,按照重要性從高到低的順序如下:
1)客戶數據: 在客戶保險服務過程中直接(或間接)采集的相關數據;
2)業務數據: 提供保險服務的應用系統產生的業務數據;
3)運營管理數據: 公司經營管理過程中采集或產生的業務數據;
4)辦公數據: 員工辦公相關的數據或臨時業務數據等。
根據上述的分類結果來看,依據業務系統和數據存在形式是非常便于數據備份管理的,而數據來源這樣的三級子類往往與數據備份的顆粒度不一致,比如某個 IT 系統的數據庫中包含了客戶數據和業務數據,這樣的情況下則優先記錄為重要性更高的客戶數據。最終業務系統的備份數據分類可參考如下表:
一級子類 | 二級子類 | 三級子類 | 備份數據信息 |
XXX系統 | 結構化數據 | 客戶數據 | XXX系統數據庫備份 |
非結構化數據 | 客戶數據 | XXX系統客戶單據 | |
業務數據 | XXX系統交易信息 | ||
運營管理數據 | XXX系統程序代碼 |
3.2 數據備份定級標準
數據備份重點保障了數據的可用性和完整性,所以定級標準中應該體現可用性和完整性需求的不同。上文的數據分類方法已經提供了部分的定級依據,但是還需要綜合考慮數據被破壞后的影響范圍、影響客體以及數據自身價值等特點。包括以下的數據特征的定級評估因素:
數據實時性:評估數據的實時性要求,實時性高的數據需要考慮更高的數據保護級別;
數據影響性:評估數據完整性被破壞后,對社會秩序、客戶權益以及企業利益的影響程度,一般來說社會秩序和客戶權益應高于企業利益,但在備份管理定級中,影響客體區分度不大,更關注影響程度;
數據獨有性:業務應用重現數據的完整程度、數據接受補錄的難易程度;
數據的審計需求與法律風險:數據是否涉及后期審計的需求,是否存在一定的法律風險,一般來說法律風險是需要特別關注的。
綜合上述分析,最終制定如下四個數據備份保護級別:
數據備份保護級別 | 數據一般特征 |
4 | 業務數據或客戶數據,數據具有很高的獨有性,數據完整性破壞后對社會秩序、客戶權益以及企業利益有較大影響,數據具有獨有性,或數據的實時性要求較高,或數據丟失存在較大的法律風險 |
3 | 其他客戶相關對外服務的業務系統數據,數據獨有性不高,數據完整性破壞后對社會秩序、客戶權益以及企業利益影響較小,數據丟失存在一定的法律風險 |
2 | 其他業務系統數據,數據完整性破壞后對社會秩序、客戶權益以及企業利益有較小影響,數據具有較小的獨有性,實時性要求不高 |
1 | 公司運營管理或辦公相關的數據,只對該系統可用性有影響 |
數據備份保護級別最高為 4 級,對于保險行業來說,一般符合第 4 級數據特征的數據可總結為核心系統中的客戶、承保、賠付相關業務數據,資金系統中的資金運用數據,財務系統中的財務數據、官網系統銷售數據及相關系統日志;第 3 級主要是其他客戶相關對外服務的業務系統數據,這類數據往往也具有一定的法律風險;第 2 級一般為其他業務系統數據,有一定的數據價值;第 1 級為公司運營管理或辦公相關的數據,往往能承受一定的數據丟失。
3.3 數據備份定級策略
從技術方案層面看,數據備份保護手段主要包括:
1)本地備份:定期數據備份,備份數據保存在本地數據中心,保留多個備份版本,備份頻率依據備份管理成本和投入資源來定,個別數據量級高的備份任務可能是每月執行一次;
2)備份同城轉儲:定期數據備份,備份數據轉儲到同城數據中心,保留多個備份版本(同城數據容災);
3)備份異地轉儲:數據備份轉儲到異地的數據中心(異地數據容災);
4)長期歸檔:設定數據歸檔保存期限,歸檔至少會有兩份數據,分布在不同的數據中心(最通用的針對數據的長期數據保存和備份的方法);
5)數據異步復制:一般用于重要數據被誤刪時應急處置措施;
6)數據同步復制或存儲同步:基于數據同步復制或存儲鏡像技術的數據保護,保障數據實時同步。
對于不同的數據保護級別的數據,綜合采用上述的數據保護方案,建議如下表:
數據備份保護級別 | 第1級 本地備份 | 第2級 同城備份 | 第3級 異地備份 | 第4級 重要數據備份 |
本地備份 | 是 | 是 | 是 | 是 |
備份轉儲 | 本地 | 同城轉儲 | 異地轉儲 | 異地轉儲 |
長期歸檔 | 否 | 否 | 定期歸檔 | 定期歸檔 |
數據異步復制 | 否 | 否 | 是 | 是 |
存儲復制或存儲快照 | 否 | 否 | 同城范圍 | 同城+異地 |
RPO | 0-4周 | 0-2天 | 0-4小時 | 0 |
金融行業的重要數據經常會因為業務需要、內外部監管審計或司法相關事件而需要恢復多年前的業務數據。所以需要重點關注數據保護級別為 3-4 的數據,不能隨意清理回收存儲資源,應制定數據長期歸檔策略,重要歸檔數據應至少保存到業務數據失效后的十年或永久存檔。
4. 小結
隨著數字化轉型的深入,除了關注數據備份技術的運用,數據備份管理也需要多關注數據對象本身,在數據分類定級的基礎上,采用多種數據備份手段相配合的方式,來制定和完善符合企業發展需要的數據備份策略。