譯者 | 崔皓
審校 | 梁策 孫淑娟
開篇
眾所周知,云服務并非金剛不壞之身。現實中,云服務中斷的例子比比皆是,一旦發生就會對企業造成巨大損失。那么,怎樣才能保障業務在云服務中安全運行呢?
云中斷所面臨的問題
亞馬遜云服務AWS 曾因一個錯誤字符導致其 S3 服務器癱瘓,連帶大批互聯網應用隨之宕機,由此人們不得不意識到云服務和互聯網是多么脆弱。在這次事件中,亞馬遜的員工甚至都來不及登入自己的儀表板來發出警告,可見其故障影響程度之深。
除了如此震驚全球的大事件,小規模的云中斷事件也接連不斷。比如今年,一連串的云中斷影響了一眾云供應商,包括AWS、谷歌云以及微軟 Azure等等。
對于許多 IT 團隊來說,這些事件暴露了同一個問題,那就是小到拼寫錯誤都有可能嚴重影響企業的整體業務。根據企業的部署和架構不同,其影響很可能帶來滅頂之災。
因此,在制定業務連續性計劃時就需要考慮云中斷的問題。但是,由于在公共云上的應用程序范圍太廣,要找到一種降低中斷風險的方法實屬困難。
遭遇云中斷實屬不幸,但無法避免
沒有那個系統能確保萬無一失。哪怕戰略再周密,無法預計的黑天鵝事件也會帶來惡果。
遭遇云中斷確實是不幸的,但它也無法避免。它的發生就像家常便飯,幾乎每個云服務商都會遇到。
雖然許多公司已將云中斷納入其災難恢復計劃,但仍有一些公司還在撓頭應對中斷對業務帶來的全新風險。
使用“云無關架構”轉移工作負載
使用“云無關架構”是企業保護自己免受云中斷影響的一種方法。這意味著系統架構不依賴于任何單一的云供應商,并且能夠在發生云中斷時在云供應商和區域之間進行無縫切換,即在云服務商和區域之間進行工作負載的轉移。“云無關架構”的模式使企業可以自由選擇最適合其需求的云服務供應商,即使在某個云供應商離線的情況下也是如此,從而確保數據始終安全且可用(無縫切換到其他云供應商)。
但是,讓企業應用“云無關架構”是一個復雜且昂貴的過程。
俗話說的好:“不要把所有的雞蛋都放在一個籃子里!”所以,企業自然也可以將數據運行在多個云上,從而通過這種方式對抗云中斷,讓企業應用和數據更加安全。
這也就是為什么多云架構和分布式系統中的數據彈性最近成為了熱門話題。當關鍵業務解決方案的架構設計在多個云供應商以及在本地基礎設施運行時,業務領導者就可以放寬心了,因為他們知道數據的安全可以保障,公司能夠持續 7*24 全天候運轉。
也正是因為云中斷,企業開始重新評估應用程序的部署和構建方式。意識到宕機不可避免可以幫助市場構筑一種適度的緊張感,從而推動人們思考如何構建軟件系統,更加負責任地開展行動,并將彈性視為頭等大事。
對于一些公司來說,這意味著要重構他們的應用程序,使其能夠跨多個公平臺運行——這對在云中斷中幸存來說非常重要。
而創建與云無關的應用程序則是公司提高數據彈性的一種方法,這使他們的數據能夠在發生災難或中斷時自由地在云區域和供應商之間無縫轉移工作負載。
選擇與云無關的架構則可以讓公司省心,即使合作的云供應商發生了狀況,他們的數據也能保證安全。
對大多數組織而言,云無關的復雜性令人望而卻步
雖然與云無關架構的想法在理論上聽起來很棒,但解決方案實施起來既不簡單也不便宜。這需要花費大量時間,同時還要雇傭高技能的 IT 專業人員才能完成。
此外,公司也很難改造存在多年的復雜應用程序以讓其跨多云運行。對于許多組織而言,其復雜性和成本可能令人望而卻步,更不必說它要求的專業知識也是挑戰。不過,還是有一些方法可以讓 IT 團隊輕松地部署這些新架構。
IT 團隊可以尋找實施多云基礎架構即服務 (IaaS) 的方法,而不是自己搭建工具。公司則需要提高彈性并采用與云無關的架構。此外,讓多云變簡單也是很重要的一方面,這樣人們就無需擔心它們的問題了。
公共云中斷不可避免,我們也無力阻攔。但是,企業在應對時可以通過云無關架構讓應用與云無關,并避免對單一云供應商的完全依賴。
譯者介紹
崔皓,51CTO社區編輯,資深架構師,擁有18年的軟件開發和架構經驗,10年分布式架構經驗。曾任惠普技術專家。樂于分享,撰寫了很多熱門技術文章,閱讀量超過60萬。《分布式架構原理與實踐》作者。
原文標題:??How to Architect for Resiliency in a Cloud Outages Reality??,作者:Cyril Plisko