如何避免云服務中斷的企業秘籍
我們不能阻止云服務提供商服務中斷。但是,有許多方法可以保護自己。亞馬遜4月份發生的聲名狼籍的云服務中斷事故使包括Foursquare和Reddit在內的一些流行的網站斷網。但是,亞馬遜的許多客戶安全渡過了這場風暴,沒有發生斷網故障。這些用戶設計自己的系統具有彈性,使用多個可用的區域,在傳統的數據中心進行熱備份或者在云提供商設置中有一個備份并且準備在一旦出現故障時開始運行。
硅谷的照片共享公司SmugMug甚至在其競爭對手斷網的時候仍然在這個中斷故障期間保證了連接。保證連接的部分原因是SmugMug沒有使用亞馬遜的彈性塊存儲。亞馬遜的這個服務組件發生了斷網故障。但是,SmugMug還把它的系統分散在亞馬遜稱作“可用區域”的幾個數據中心。
SmugMug***執行官Chris MacAskill稱,其它公司如果也把自己的應用程序分散開的話也能在中斷故障時保持連接。MacAskill還建議企業使用多個亞馬遜區域,這些區域比可用區域的隔離程度還要高。當然,亞馬遜要對使用多個區域收取額外的費用。因此,這些需求需要考慮。
SmugMug主要依賴亞馬遜,使用亞馬遜基于云的S3(簡單存儲服務)服務存儲用戶的照片和視頻。SmugMug還使用許多EC2(彈性計算云)的實例。但是,SmugMug沒有使用亞馬遜的彈性塊存儲,而是仍然使用傳統的數據中心。亞馬遜彈性塊存儲附加在單個的EC2實例,通常用于存儲運營數據。
MacAskill稱,那有它自己的弱點。例如,在亞馬遜發生中斷故障的那個星期,該公司失去了一個核心路由器、它的備份和一個核心的主數據庫服務器。我希望我不必再處理路由器或者數據庫硬件故障問題。這是我們仍在朝著云方面發展的原因。
他說,盡管發生中斷故障,他從亞馬遜得到的基于云的服務仍比SmugMug自己的東西好,并且比其它云服務提供商的服務好。我們完全相信這些服務。以色列的創業企業Kitely僅使用一個亞馬遜的可用區域。但是,幸運的至這個區域沒有發生中斷故障。然而,Kitely計劃從這次體驗中吸取教訓。Kitely負責研發的副總裁Oren Hurvitz稱,我們打算把我們所有的服務分散到多個可用區域。Kitely運行基于OpenSim平臺的基于云的虛擬會議和協作環境。Kitely不斷地進行檢查以保證其服務的正常運行。Hurvitz稱,我們的系統是根據任何服務都可能在任何時間停止工作的假設設計的。如果我們發現一臺服務器沒有反應,那么,我們就關閉這臺服務器并且啟動一臺新的服務器。
傳統的備份
另一家公司沒有受到中斷故障影響是因為它使用了多個可用區域。這家公司名為Mashery。Mashery向百思買、Hoovers和紐約時報等100多家公司提供應用程序編程接口。但是,Mashery還有另一個備份計劃,一個傳統的數據中心。
Mashery***執行官Oren Michels稱,我們非常早地認識到可能會出現服務問題使亞馬遜完全不可用。我們確定我們需要容錯基礎設施。我們有Internap公司的專用硬件。位于亞特蘭大的Internap網絡服務公司不僅為Mashery提供熱備份網站,而且還為需要比云服務速度更快的服務的那些用戶提供一個生產環境,或者在亞馬遜沒有提供服務的地區提供服務。Michels稱,我們在兩邊都有許多基礎設施以處理高峰的工作量。
當Mashery兩年前開始建立自己的云基礎設施的時候,亞馬遜是城里的唯一的真正的運營商。向另一個云進行備份在當時還不是一個選擇。但是,現在這可能是一個選擇。Michels稱,我們確實在關注這個事情。但是,如果它沒有壞,就不要修理它。亞馬遜與我們的合作非常好。同樣,Internap一直是一個很好的合作伙伴并且繼續向我們提供我們所需要的服務。
Michels補充說,Internap甚至降低價格以保持競爭力。不過,價格不是他決策的主要因素。我們有100個大品牌廠商客戶。一旦發生故障,丟失大客戶的損失會更大。我們的客戶向我們付費解決其應用程序編程接口問題。那包括如果發生中斷故障,我們能繼續保持連接。
市場研究公司Enderle Group的分析師Rob Enderle稱,剛剛開始向云過渡的企業在開始的時候通常使用傳統的數據中心作為備份。Enderle稱,你可以有一套次要的資源處于待機狀態。你可以把容錯轉移到這些資源。這些資源通常是你向云過渡之前所擁有的設備。你可以容錯到較低性能的技術并且仍擁有你的客戶。
但是,Enderle警告稱,不要多分相信在同一個云服務中使用一套云服務作為另一套云服務的備份。他說,一個冗余的服務可能使用同樣的資源作為主要的服務。應該加小心以保證那個冗余的服務是冗余的,而不是重疊的硬件和軟件的一個不同的名稱。
#p#
備用云提供商
使用一個云服務提供商作為一個傳統的數據中心的備份主要是為了節省成本,而不是為了采取其它方法。那是因為采用一個云服務提供商,你為計算周期付費。當沒有使用的時候,用戶只需要保持***的計算能力運行以實現迅速的轉換,然后根據需要增加更多的服務器容量。
擁有一個傳統的數據中心,必須有足夠的服務器處理高峰的工作量,盡管這些服務器很少使用。這就涉及到硬件成本以及電源和配備人員的需求。一般來說,一個傳統的備份中心會使計算總成本增加一倍,而云備份僅增加一部分成本。
例如,總部設在拉斯維加斯的基于Web的硬盤加密廠商AlertBoot的***執行官Tim Maliyil稱,該公司過去每月支付5萬美元電費。他說,我們在一個地方有兩個數據中心。你不相信我們關閉它有多么高興。現在,兩個云服務、帶寬和托管成本是每月1.6萬美元。以前,電和容量的浪費太大了。云服務真正把我們的成本和運營開支減少到***水平。
向云提供商過渡不是很困難,因為AlertBoot在其傳統的數據中心已經在使用VMware的虛擬化軟件。該公司選擇的兩個云提供商SunGard和OpSource也都使用VMware軟件。Maliyil稱,從一個云提供商轉換到另一個云提供商只需要一兩分鐘。備份云能夠迅速啟動以處理增加的工作量。這個轉換本身是由一家英國廠商Zeus Technology提供的服務處理的。這家公司幫助企業把應用程序從一個云遷移到另一個云。
Maliyil稱,他的公司選擇這些廠商是因為這些廠商是以企業級的可靠性而聞名的。對于我們進入的這種業務,我們的客戶缺少容錯能力。我們已經從亞馬遜的基礎設施轉移到這里。幫助企業管理在多個云中運行的服務的另一個廠商是rPath。rPath擁有90多個企業用戶,大多數是大企業和互聯網服務提供商,包括AMD、富士通、高通和EMC。
rPath目前應用16種類型的鏡像格式。所謂鏡像是在云環境中運行的應用程序的快照。rPath***營銷官Jake Sorofman稱,向這個列表中增加另一個云一般需要不到一個星期的時間。這對我們來說是非常容易的一件事。
Sorofman稱,rPath目前支持亞馬遜EC2、VMware、思杰Zen、微軟Hyperv、Rackspace以及其它一些格式。一旦應用程序進入rPath系統,它只需15分鐘就能生成一個新的鏡像并且把這個鏡像部署到一個新的云。
然而,首先為rPath系統設計一個應用程序需要較長的時間。Sorofman稱,根據復雜程度的不同,為我們的平臺封裝一個新的應用程序的過程需要幾個小時至幾天的時間。但是,我們有一個專業的服務團隊。如果客戶選擇他們的話,他們可以為客戶做這些事情。
Sorofman稱,許多應用程序已經封裝了,包括完整的Windows和Linux操作系統、WebLogi以及WebSphere、SAP、EMC和RSA的產品。使用我們的技術建立模型并且能夠使用的完整的堆棧列表還有許多。Sorofman表示,擁有把更多的應用程序在云中轉換的選擇不僅為企業提供了備份的選擇,而且還允許企業從他們的提供商那里得到盡可能優惠的交易。
Sorofman說,這些選擇帶來了套利的機會。能夠根據性能、政策和價格優化工作量在什么地方運行。在某種程度上,你能夠輕松地在亞馬遜、Rackspace和其它環境中遷移工作量。因為你消除了廠商鎖定,你可以利用你的多個服務提供商。