因亞馬遜服務器故障服務中斷誰的錯?
上周,亞馬遜在弗吉尼亞州(Virginia)北部的云計算中心宕機,導致包括Quora、新聞服務Reddit、Hootsuite和位置跟蹤服務FourSquare在內的眾多網站都受到了影響。受影響的這些網站都依靠亞馬遜的這個云計算中心提供服務。
Everyblock網站也是其中一個受影響的網站,但是令人驚訝的是,他們并沒有把所有的錯歸咎在亞馬遜上,“坦白地說,我們搞砸了,”Everyblock網站的一位技術人員Paul Smith在其博客上寫道:
“AWS就明確建議開發者在設計網站架構時,應該考慮網站的彈性考慮到意外的失敗和中斷,比如說昨天的中斷,但是我們并沒有遵守這個建議……我們是否在我們跨區域的服務器都部署了,是否考慮到ASW建議的那些單獨服務器和其他服務,我們可能還會在同一個地方跌倒。”
Paul Smith是比較理智的,因為如果你閱讀亞馬遜的“AWS網絡托管最佳實例(PDF)”,你回看到里面明確的寫著很多建議,幫你度過中斷的建議。
當然,筆者并不認為亞馬遜就無過錯了。多日的宕機影響了東部眾多地區的服務本身就是一個很嚴重的問題。他們的報告寫道:“一些多排列故障轉移需要的時間比預期的長”,受影響的用戶有權生氣發脾氣。另一方面,用戶也受到警告——如果他們想要容錯能力,那么就需要在多個地區建立故障轉移。但是他們沒有這樣做,網頁服務被關停,這又是誰的錯呢?
出現這樣的問題,并不是因為云計算不能被信任。問題的關鍵在于正確部署一個云計算應用并不像購買一些服務器實例一樣簡單。但是話又說回來,在你自己的數據中心部署一個關鍵任務應用也沒有設置一些服務器來的簡單。
CSS公司的云服務部門高級副總裁Ahmar Abbas指出:“充分利用本地AWS能力的組織,例如為所有應用建立亞馬遜機器鏡像,優化快照,利用多個其他地區隔離的AWS,就能夠成功度過這些終端。”上周并未受影響的一位亞馬遜云服務用戶Netflix表示。
云計算最大的優勢就是能夠簡單輕松的進行擴展,你可以很快的部署一個非關鍵應用,但上周亞馬遜的中斷,讓筆者學到了兩個教訓:遷移到云中并不能消除你對IT專業人士的需求,另一個教訓就是如果你不遵循提供商的建議,那就等著火燒眉毛吧!
【編輯推薦】
- 使用Microsoft Azure 讓云遷移變得簡便的5種方法
- VMware的混合云遷移工具:vCloud Connector
- 企業CRM等業務系統遷移到 "云"中的最佳實現
- 云計算該“遷移”還是“自建”?
- 云遷移全攻略:哪些應用適合遷移
- 亞馬遜 谷歌 微軟三大試用云服務大比拼(上)
- 亞馬遜推出1年免費云計算服務
- 亞馬遜EC2中斷 “可用區”遭質疑
- 傷不起!亞馬遜史前最大宕機事件的啟示
- 云震 -- 亞馬遜4.21事故的反思
- 從亞馬遜云服務故障中吸取的七個教訓
- 云計算與集群:是攜手還是爭斗?