災難恢復規劃云服務與避免痛點
災難恢復即服務(DRaaS)是一個新興的服務,它可以很好地實現一個云提供商的產品組合。相比較昂貴的、笨拙的傳統災難恢復,DRaaS是一個低成本替代品。但云災難恢復服務不僅僅是指云存儲;它們還包含計劃、過程、集成、測試和持續不斷的警惕。如果出現錯誤,DRaaS會為你的客戶的業務和你的聲譽帶來災難。下面是如何避免陷阱并成功地進入DRaaS市場。
直到一場異常強烈的風暴重創北弗吉尼亞,導致了嚴重的亞馬遜彈性計算云(EC2)2網絡服務停電, derecho才被人們所認識。這次事件使亞馬遜知名客戶NetFlix、Dropbox、Pinterest、Instagram和Heroku,連同一些其他不幸的人倍受打擊。任何商業利益由于服務中斷受到嚴重傷害的企業,都是DRaaS潛在的候選人。
誰需要基于云的災難恢復服務
傳統的災難恢復服務復制兩個數據中心之間的應用程序狀態,所以如果主要的數據中心變得不可用,備份站點通過使用最近復制的數據,可以接管并激活一個新的應用程序副本。災難恢復服務非常適合云,因為在正常情況下, 需要最少的資源來同步從主站點到云的狀態。用來實際上運行應用程序的資源,只需要在災難發生時被完整補充。失敗后,額外的資源被迅速召集用于快速恢復,從而使業務連續。
現在,如果客戶的應用程序已經運行在虛擬環境中,相比較傳統的災難恢復,基于云的DRaaS是一種可行的替代。傳統的災難恢復服務最適合服務于運行在主機和混合計算環境的應用程序。
SunGard已經提供傳統數據災難恢復服務30多年,去年添加了基于云的災難恢復。根據SunGard Availability Services恢復服務的產品管理的資深主管Ram Shanmugam所說,大約20% SunGard的客戶在完全虛擬化的環境下運行應用程序—現在使用SunGard的DRaaS產品。Shanmugam預測在接下來的兩年,擁有完全虛擬化環境客戶的比例,將增長20%至60%。如果他的預測是準確的,DRaaS將很快進入自己的市場。
如何實現DRaaS并避免痛點
基于商業考慮和很好地定義認識和聲明災難的流程,實現DRaaS解決方案時,需要創建一個具有恢復點目標(RPOs)和恢復時間目標(RTOs)的云災難恢復計劃。它還需要網絡、防火墻、負載平衡器、Web、數據庫和存儲層之間的緊密集成。根據Shanmugam所說,存儲是在堆棧底部, 并且必須具備 DRaaS來恢復存儲之上的整個堆棧,否則恢復將會失敗。
一個DRaaS實現的棘手問題是,所有原始站點和備份站點的操作系統軟件,就供應商和版本號而言,必須是整體統一的。這使得從客戶的私有云到你的云或者服務提供者云之間,提供DRaaS產品具有挑戰性。任何時候軟件的變化,都可能帶來不兼容問題,并且活動不能順利進行下去。
另一個實現問題是,迄今為止,供應商的解決方案專為企業設計,缺乏一個特性集,在該平臺上可以構建基于云的,多租戶的解決方案。因此,云提供商被迫做他們自己的軟件開發。
Hosting.com的首席技術官Craig McLellan,解釋了這個問題。“在實現云災難恢復作為服務過程中涉及一連串困難問題。其中一個我們學到的關鍵事情是,出售產品給服務提供者的供應商們,幾乎沒有人了解任何關于在一個多租戶云足跡平臺上提供災難恢復服務。這些供應商的可用API嚴重不足。他們不將hypervisor透露給客戶,所以我們不得不編寫軟件來為客戶提供測試和管理服務的途徑。所有的供應商都不期望那樣。如果他們有一個API,我們可以創建多租戶抽象—如果沒有,這是非常困難的。”
McLellan還指出,供應商設計災難恢復使用的產品。在過去,測試每年發生;RPO并不是那么積極。他說“現在我們需要測試的頻率更高,要做到這一點,測試必須是100%無干擾的。目前我們必須手動完成,即侵入。我們需要的是一個在中間的可靠的編排層”。
McLellan還提到,良好的性能數據很難獲得。對于服務提供者來說,服務水平協議(SLA)是關鍵,因此性能是關鍵。“如果沒有良好的測試設備,我們不能提供SLA。如果你不能說出你的服務是如何執行的和告訴客戶如何聲明一個災難,除了上帝,沒有人能幫助你。它可以輕易地毀掉服務提供者的聲譽。”
他說他的公司通過投入自己的測試設備或通過一個員工來過度補償,因為服務提供商沒有第二次機會。他說:“在這個空間沒有寬恕。只有很多競爭,和相對較低的轉換成本。”
更有效的DRaaS產品合作
如果你打算以自己動手的解決方案進入DRaaS市場,準備好“照亮”前路。如果解決該選擇可能優先級比較低,但是也許能夠招募一個合作伙伴,幫助你快速進入DRaaS市場。
考慮到推出自己的DRaaS產品是不容易的,你可能考慮外包給第三方。SunGard將其DRaaS云服務轉售到其SunGard品牌下的一個提供商,該提供商隱藏于災難恢復領域。但是如果你選擇,可以為服務貼白標。
你還可以與一個像CloudOps一樣的云系統集成商一起工作。據CloudOps 的CEO Ian Rae所說 :“我們可以構建一個基于云的災難恢復解決方案并為客戶來管理它。與向我們這樣的云系統集成商工作的優勢在于我們對宕機后需要什么來參與重建一個應用程序有很好的理解。”
云災難恢復服務的前景
云災難恢復服務可能很快流行起來,有遠見的云提供商應該將他們的注意力放在如何利用接下來發生的事情上。一種可能性是服務提供者的多樣性。正如地理多樣性對災難恢復計劃很重要,服務提供者的多樣性也很重要。時刻準備著,尋找方法向其他云提供商的客戶提供DRaaS。從長遠來看,這將幫助你擴大你的顧客并增加收入基礎并可能贏得額外的服務業務。