預見黑天鵝:用多云戰略規避業務中斷之傷
黑天鵝寓示著不可預測的重大事件,他們常常帶來意料之外的重大沖擊,但人們總是視而不見,并習慣于以自己有限的生活經驗和不堪一擊的信念來解釋它們,最終被現實擊潰。
——《黑天鵝:如何應對不可預知的未來》
云的穩定可靠不單單是云服務提供商一直致力提升的關鍵點,也是云化型客戶自身業務發展的痛點。黑天鵝事件的頻發,值得我們去思考如何在享有云計算技術紅利的同時,把握自身業務連續穩定的主動性。
如同世界氣象組織發布的十種云類型,“云”這種技術作為企業數字化轉型的支撐力量,也趨向于多種形態發展。從私有云、公有云、混合云的部署形態,到多云戰略的提出,形態間的邊界因“穩定可靠”的共同訴求而弱化。所以,如何結合自身場景,從更廣義的多云戰略視角通過容災方案來實現業務的連續穩定,是我們關注的重點。
一、典型多云布局,讓業務不再被動
嚴格意義上的多云戰略與混合云的區別,主要在于多云不強調公、私兼備,而是“公、私、混合”形態的組合方案,如用戶選擇至少兩朵不同廠商的公有云。其優勢,除了可以利用多個不同云廠商自身的差異化服務,將流量傳輸到相應的業務云來降低成本外,更可在一家廠商出現如宕機等事故造成業務不可用時,快速將業務切換到另一朵云來保證連續性,即用“多云容災”的方式詮釋“雞蛋不要放在同一個籃子里”的共識。
進行多云容災前,需明確業務類型。對于無狀態應用,建議從跨云應用雙活方案著手,以負載分擔的方式強化業務處理能力,并在單點故障時將全部請求進行引流。具體方案可參考華為云技術公眾號《如何自助快速搭建“跨云安全容災系統”》。對于稍復雜的應用,往往需要經驗豐富的IT團隊進行多云方案的設計與遷移,而依托華為17年容災實踐,我們將通過容災咨詢服務為企業定制容災方案。
二、云上多點部署,快速實現高可靠
由于人員誤操作、硬件故障等因素造成的宕機往往發生在個別可用區內,企業可通過跨AZ容災策略進行快速規避。不同云廠商對此支持程度不同,以華為云為例,存儲容災服務(SDRS)提供了業界唯一跨AZ RPO=0的容災能力,保障數據零丟失。容災端虛擬機正常時無需啟動,更節省容災成本,同時提供的容災大屏及一鍵式容災演練功能讓客戶實時了解業務可用狀態,并讓日常演練更加便捷。SDRS服務將于3月30日正式商用,敬請期待。
再進一步,為防范如自然災害等不可抗力造成的地域性影響,可采用云上兩地三中心方案部署,將生產數據中心和容災中心部署在華為云兩個不同Region,并在生產中心采用上述雙AZ部署方案。生產站點某AZ故障時,切換到另一個AZ并進行數據庫主備切換;當生產站點全體故障時,切換數據庫主備狀態,并將DNS授權修改為生產站點0%,容災站點100%。本方案可提供***程度的業務連續性和數據可用性保證。
華為云混合云災備解決方案全景圖
誰也不知道,隱藏的暗流何時會變成滔天巨浪。我們畏懼的不是黑天鵝引發的事故,而是沒有應對事故的能力。若想在事故發生后仍能掌握主動權,保證業務連續穩定運行,多云戰略就應該早日提上議程。
一次次事故為我們敲響警鐘,未雨綢繆遠比事后亡羊補牢更為重要。
了解更多華為云混合云災備解決方案,請訪問:https://www.huaweicloud.com/solution/hcdr/