亞馬遜EC2中斷 “可用區”遭質疑
原創【2011年4月25日51CTO外電頭條】對于愿意多付一點錢的云客戶,亞馬遜提供了一項很有誘惑力的提議:將應用分布到多個可用區(availability zone)上,可獲得一項幾近保證的服務:不會遭受宕機之苦。
“在分開的可用區上運行實例,可放置你的應用程序在單個位置上出現故障。”亞馬遜在推廣其彈性計算云服務(Elastic Computer Cloud)時如此說道。
只在一個可用區上創建應用的客戶更容易遭受服務中斷的故障。但是,多個可用區同時停止運行時將會怎樣?我們已經看到了結果:一次服務中斷令多家網站無法訪問,其中包括 Foursquare、Reddit、Quora 和 Hootsuite。
“我們可以確定,在美國東1地區的多個可用區中,連接故障影響了 EC2 例程,并且不斷增加的時延影響了 EBS(彈性塊存儲)容量。”周四亞馬遜在其服務狀態控制板上指出。
美國東1地區,位于北弗吉尼亞州,是世界各地的多個亞馬遜服務地區之一。在北加利福尼亞州還有一個服務地區。在東部時間凌晨 4:41 時,亞馬遜開始報告故障。到下午 1:26 時,亞馬遜稱他們“現在看到故障和時延在顯著地下降”,但是問題仍沒有消失。亞馬遜認為是一起“網絡故障”引發大量的存儲區進行再次映射,從而造成了容量短缺。
根據加特納公司(Gartner)分析師德魯•里維斯(Drue Reeves),雖然每個地區包含多個可用區,但對于每個可用區,已知的信息很少。在弗吉尼亞地區有四個可用區,里維斯說道。但是,這些可用區是否位于不同的數據中心?它們之間相距多遠?數據如何跨區復制?里維斯稱,對于這些問題,亞馬遜沒有保持透明性。不知答案讓顧客的選擇變得困難:創建高可用的應用時,使用哪種方式最為有效。
“多年來,亞馬遜一直稱為了避免整個地區發生服務中斷,他們在一個地區中運行了多個可用區。”里維斯說:“但我們現在還是發生了故障,而且是整個地區的 EC2 出現中斷。”
亞馬遜發言人尚未對評論請求作出回應。
也許顯而易見,亞馬遜多等級承諾為每個地區提供了 99.95% 的可用性,但并不是對于每一個可用區。對于許多客戶,這已足夠優秀,但還遠未達到 5 個 9 的高可用性標準。
在 EC2 網站的可用區描述中,亞馬遜稱,這些可用區位于“不同的位置,其設計將其與其他可用區故障分離開來,并且可提供廉價的低延遲網絡連接至同一地區中的其他可用區”。
這些都引發了一個疑問:能否創建跨地區的應用,如果需要,可從弗吉尼亞州向加利福尼亞州進行故障轉移?
云軟件提供商 Enomalv 公司的創始人兼 CTO 魯文•科恩(Reuven Cohen)想得更遠??蛻魟摻ǖ膽脩瑫r運行在多個來自不同銷售商的云平臺上,他如此說。
已知的運行在多個可用區上的大型網站發生中斷,這一事實表明這些可用區并非萬無一失。
“事情最會出現問題。這是互聯網自身具有的本質。”科恩如此說:“因為你是亞馬遜,你就可以提供 100% 的正常運行。這種想法是錯誤的。”
“銷售商可能提供了冗余性……但這并不能解決這一問題:如果該銷售商的所有方式都出現中斷將會怎樣?”科恩說道。
客戶應與提供多個地點的多家提供商簽訂協議,從而可以在單個銷售商發生故障時能夠幸免于難,他指出。
但是,這種方式現實嗎?里維斯給出了否定的回答,只是對于大多數客戶是如此。云計算應簡化應用的部署和管理。創建一個可工作于多家銷售商平臺上的應用需要大量的額外投入。
“無法在多家云提供商上構建應用的原因在于,缺少標準和互操作性。”里維斯說道:“如果你是應用創建者,你需要增加存儲或計算容量,這些容量的分配、收費和使用,對于每個提供商都是不同的。這不是做不到,而是非常非常困難。”
還有一個更簡單的想法:只使用亞馬遜的服務并且應用平衡分布在多個地區。但是,這個想法并不是想象的那么簡單。亞馬遜沒有提供必要的工具,可以在地區之間進行負載平衡,所以客戶必須在他們亞馬遜例程之上使用額外的軟件,里維斯指出。亞馬遜的負載平衡服務可在多個可用區上工作(與周四出現故障的那些服務相同),而不能跨地區工作。
無論任何時候,如果出現云故障,總會有人質疑所有的云計算服務。但事實并非如此,里維斯如此說,并指出“每個人都會有宕機的時候”。云計算的不同之處在于云服務提供商將風險積聚在一處——許多公司使用一個平臺運行他們的網站,一旦該平臺出現服務中斷,相對于一家公司內部數據中心出現故障,將會吸引更多的注意。
一家云服務提供商出現故障不應抱怨所有的云計算都不可靠。里維斯指出,這的確令想要使用云服務的企業三思,在將服務轉移到云之前進行經濟分析,他們會更加小心。如果公司將主要的業務運行在亞馬遜平臺之上,那么發生中斷故障時他們將數百萬美元的收入損失,為了不用在公司內部創建 IT 服務以節省成本而承擔這種潛在發現是否值得?
服務等級協議可能會提供賠償或貸款,但如果中斷故障導致數千萬美元的損失,亞馬遜將不會提供賠償,里維斯如此說道。
【編輯推薦】
- 使用Microsoft Azure 讓云遷移變得簡便的5種方法
- VMware的混合云遷移工具:vCloud Connector
- 企業CRM等業務系統遷移到 "云"中的***實現
- 云計算該“遷移”還是“自建”?
- 云遷移全攻略:哪些應用適合遷移
- 亞馬遜 谷歌 微軟三大試用云服務大比拼(上)
- 亞馬遜推出1年免費云計算服務