IT服務持續性只適合有錢的企業嗎?
大多數組織都非常關注備份和恢復策略。如果IT環境出現問題,目標是讓系統在最快時間內恢復到你已知的某個結點。
任何備份與恢復的策略都是設法將一切恢復到距離現實最近的時間節點。從技術角度來說,這意味著恢復點目標(RPO)和恢復時間目標(RTO)越接近接好。通過快照和虛擬機,停機時間往往在幾小時甚至幾分鐘。
在RPO和RTO之間依舊存在問題,在此期間無法提供服務。IT平臺要么宕機要么正忙于恢復。直到數據中心啟動并恢復運行,在此期間業務不斷流失:IT是導致失敗的原因。
擁有高可用性需求而且財力雄厚的公司研究了過去的業務持續性方案,要么是通過集群與虛擬化實現IT組件的N+1冗余,或者在另外一個遠程數據中心完全鏡像整個線上環境。雖然鏡像意味著災難性故障只需在幾分鐘內就能切換到功能齊全的備用環境,問題在于代價高昂。投資遠比建造單獨一個數據中心的兩倍還多,不但需要額外的數據中心與設備,同樣還需要軟件以及工具來監控與維護系統,并且在確認故障發生時完成切換。只有少數企業能承擔這筆費用。
然而時代在改變,IT服務連續系,或者與之類似的方案越來越貼近大多數組織。
新的IT服務持續性規劃
你現有的IT平臺可能混合了承載單業務的服務器也或者物理集群的虛擬化環境,甚至還可能有一兩個平臺運行在私有云。你已經擁有虛擬化基礎設施上的虛擬機,這就有可能會在未來部署容器。容器技術包括了Docker、CoreOS的Rocket、微軟Azure Drawbridge for Windows Server和Canonical的LXD Linux容器。
IT持續性規劃始于建立企業應用程序涉及到的所有資產數據庫。對于大多數組織來說,連續性并不意味著和主要設施一樣,將所有的業務都以相同的用戶體驗進行鏡像。相反,企業需要確保核心業務流程能夠保持,直到主數據中心重新上線。
運行關鍵任務應用程序的物理服務器必須能在斷電的時候繼續運作,但它可能不需要被作為一個物理系統完全復制。將應用程序配合虛擬機來運行,可以讓IT在非常短的時間內讓業務快速運轉起來,這是一個提供足夠好的用戶體驗的權宜之計。那些非關鍵任務的業務,如工資單或采購程序,可以在中斷時忽略。
評估工具可以管理工作負載從原平臺遷移到可持續性管理平臺的狀況。廠商如Vision Solutions,提供Double-Take產品組合,能夠提供將工作負載從一個環境遷移到另一個環境的高可用性和業務連續能力。
一些產品包還能提供將應用程序或容器從一個環境遷移到另一個,產商有StackIQ Inc.、Platform9 Systems Inc.、Verilume和Electric Cloud(該廠商更專注于發布自動化,但還搭售打包和配置工具,實現高度可控、可審計功能)。這些工具不需要熱目標環境;他們支持動態遷移裸機、虛擬機或云環境。
通過結合云計算和虛擬化制定的恢復計劃,組織并不需要支付與鏡像數據中心那樣的龐大費用——甚至不需要支付其他未使用的資源。只需支付平臺以及所需IT服務連續性的使用費——這些支出基本在大多數組織的可接受范圍內。
如何處理中斷期間的數據
處理中斷期間留下的數據是個難題。沒有辦法向打包應用程序那樣輕易的打包數據。應用程序是個相對靜態的實體,而數據是高度動態的。你可以使用備份和恢復,但RPO和RTO都是針對一個整體備份和恢復策略來規劃的,同樣存在問題。
數據庫虛擬化是一個更好的辦法。供應商如Delphix Corp.提供工具可以在短時間內完成數據庫副本的制作,并且只消耗很少本地資源。還可以遠距離使用相同的技術:初始化數據庫的拷貝傳輸先完成,之后只需跨區域復制增量數據。任何主環境中發生故障,在遠程站點的數據拷貝都擁有實時備份。這意味著在目標站點上擁有非常多資源,同時也意味著非常高的業務連續性。
一旦主站點重新上線并且恢復運行,備份數據會與主數據庫同步,在此期間不會有任何數據損失。