異地災備:避開互聯網道路上的那些“坑”
5月27日下午5點,擁有將近3億活躍用戶的支付寶出現了大面積訪問故障。據悉,包括北京、上海、廣東、武漢、西安、湖南、浙江、四川、福建等地用戶均受到不同程度的影響,如手機和電腦支付寶無法登陸、無法正常支付、余額錯誤等問題。據支付寶官微回應稱,故障原因是杭州市蕭山區某地光纖被挖斷。2.5小時后,支付寶才恢復正常使用。
無獨有偶,18個小時后,擁有超2.5億用戶的攜程官方網站與APP也出現了訪問故障,官方回應稱其原因為部分服務器遭到不明攻擊。受此影響,攜程股價盤前暴跌11.67%,而宕機帶來的業務損失也不是小數字。近12小時后,攜程官網及APP終于恢復正常。
一時間,網民類似的戲謔之言在網上比比皆是。事實上,相關事件之所以引得廣泛關注,主要原因就在于今天的互聯網與大眾生活已緊密相關。接連發生的兩次故障事件,讓更多普通用戶只是感受到了平日里“賴以生存”的網絡之脆弱,而讓高度依賴網絡和IT能力的相關企業卻是產生了空前的關注與警醒。
周星馳電影《功夫》里有句名言:能力越大,責任就越大。而短時間的兩次故障正凸顯出互聯網+下,企業容災備份和IT管理亟待進一步提升的問題。在中國這樣的人口大國,隨著用戶數量激增,企業背后的數據安全和整個IT系統的管理也變得更加重要,影響著企業的服務質量、品牌聲譽與用戶的信賴。正因如此,探討一下企業如何避開互聯網道路上的“坑”,要遠比談論“一把鐵鍬的威力”重要得多。
萬物互聯時代更需理性
“萬物互聯時代,基礎設施的復雜性和安全問題勢必更加突出。包括今天的支付寶光纜被挖斷,攜程被攻擊宕機。再一次展示了傳統行業鐵鍬和IT時代運維管理的力量,凸顯了網絡時代的脆弱性。在互聯網+轟轟烈烈的大潮下,如何處理好營養的極大豐富,與基礎設施非常脆弱的問題?”這是某位行業專家在朋友圈里寫下的反思。
帶著這些問題,記者走訪了相關專業人士。一位國有銀行人士稱,相對移動支付或大型網站,傳統金融機構更為理性,在涉及資金交易的重要系統災備方面往往有著更充分的準備,發生大范圍數據故障的幾率更低,而這種理性也在某種程度上意味著服務安全級別的提升。
異地災備,聯手避“坑”
就此次事件記者也專門采訪了國內領先的整合IT服務商神州信息,其專家也持類似觀點:當前企業業務受益互聯網+的帶動不斷擴張,為保障業務安全和穩定,很多銀行與企業都實施了“兩地三中心”的異地災備方案,神州信息也在其中承接了很多工作。在實施過程中不僅可幫助企業在同城部署一個災備中心,還會在異地部署另一個備份中心,并在此基礎上輔以完善的災備技術與解決方案,確保數據、業務因突發災難或其他因素中斷時的及時可恢復性。實現了“兩地三中心”災備,一旦企業某個機房的核心數據庫或業務系統出現故障,系統將按照預定策略,自動切換到同城或異地的災備中心,確保業務不間斷,從而大大提高業務連續性,高度保障系統的連續運行與核心數據安全。
同時這位負責人也指出,作為中國最大的第三方支付平臺,支付寶日均支付的數據量遠遠超出一般銀行,其容災管理也更加復雜,異地災備的部署難度也更大。但企業用戶只要有數據保護的必要性,采取異地災備方式就是當前有效的解決方案之一。特別是在云備份平臺的支持下,異地災備可以最大程度的避免自然災難或戰爭等極端情況給企業造成的影響。
“24小時內出現的兩起大面積突發事件,讓每個企業重新認識到了災備和IT運維管理的重要性。大型網站的架構與業務系統錯綜復雜,各種服務之間的依賴關系也會隨時間推移難以厘清,一旦出現問題,重建過程將繁瑣耗時。只有不斷提高網絡安全意識,完善相關管理機制,才能從根源上更好地解決問題。”