阿里云午夜再宕機 云服務商99.99%的安全性有多可靠
原標題:阿里云再次宕機回應稱已全部修復
阿里云并未公開詳細賠償細節;業內人士稱,用戶可選擇“多云”部署,以避免宕機損失
阿里云又宕機了,這一次發生在午夜。
3 月 2 日 23 時 55 分左右,阿里云開始出現大規模故障,位于華北地區的多家互聯網公司的 IT 運維人員發現多個 App 和網站開始陷入卡頓。隨后一批程序員趕往公司加班。58 高級架構師沈劍在針對此次宕機的回憶文章中稱,這場事故持續了三個小時左右,事后觀察了兩個小時。
3 月 3 日早間,阿里云開始發布公告,開始全面排查。截至目前披露的結果是,華北 2 地域可用區C部分的 ECS 服務器(云服務器)等實例出現 IO HANG(IO 不響應),經緊急排查處理后已全部恢復。阿里云方面向記者證實了這一結果,并表示其他區域未發現此類情況。
針對故障,阿里云表示,將根據 SLA 協議(服務合同),盡快處理賠償事宜。但阿里云并未公開詳細的賠償細節。而根據阿里云開發者論壇上的網友說法,賠償通常是按照故障時間的 100 倍進行的,而方案則根據包年包月預付費模式和按量付費模式有所不同,但總額不超過支付的單臺云服務器費用總額。
這是一場發生在周末的宕機時間,因微博的傳播而備受關注。第三方機構 Forrester 分析師戴鯤告訴記者,華北 2 地域是阿里云最早開通服務的華北地域之一,而 ECS 服務器又是阿里云最為核心的 IaaS(基礎設施即服務)之一,影響程度應當是相對較大的。
2018 年 6 月,阿里云曾出現技術故障。盡管官方最終給出的故障時間僅為 30 分鐘,而恢復時間需要 1 小時。但阿里云最終仍將其定義為 S1 級別事故,即核心業務重要功能不可用,影響了部分用戶,造成了一定損失。
2019 年 1 月,第三方機構 IDC 報告數據顯示,2018 年上半年中國公有云廠商中,阿里云以 43% 的市場占有率***,相當于第二名至第九名的總和;騰訊排名第二,市場占有率為 11.2%。
延展
99. 99% 的安全性有多可靠?
事實上,宕機事件頻繁發生。僅 2018 年一年,全球主流云計算廠商曾發生數十起宕機事故。對于宕機的原因,亞馬遜 AWS 稱因數據中心硬件問題,微軟 Azure 數據中心則因高溫和打雷,騰訊云因運營和硬盤故障,谷歌則因自動化失效。
但與此同時,多家云服務商仍在承諾 99.99% 的安全可靠性。對此,有技術專家表示,這一數字是經過驗證的,而且通過部署反饋,故障率的確在 0.01% 以下。并且,一旦出現故障,云服務商也都有相應的容災方案,可以及時解決問題。
沈劍在上述文章中表示,更換其他方案,也會遇到其他的問題,而自建機房,更是沒有信心比阿里云更好。目前大多數公司仍在業務階段,考慮投入產出比,所以多機房模式并不適合所有公司。
如何避免宕機事故造成重大損失?有業內人士稱,需要將重要業務分別放在不同的“籃子”里,也就是選擇多個供應商,進行“多云”部署。負責運營微軟云服務落地的世紀互聯藍云***執行官柯文達表示,真正的企業級市場中,用戶一定是希望“多云”部署。
不過,也有行業人士認為,“多云”部署,會帶來管理、開發、人員培訓的復雜性,也可以選擇多區域部署的方式。
市場對云計算的需求仍在增長
云計算取代舊有 IT 部署的趨勢已不可逆。Gartner 數據顯示,云計算占全球總 IT 支出的規模正在不斷增加。從 2010 年的 1.99%,上升到 2018 年的8%,而未來幾年向云轉移將會直接或間接影響超過 1 萬億美元的 IT 支出。
這一切變化發生在過去十年中。十多年前,無論是跨國巨頭,還是創業公司,部署 IT 架構的思路都是相同的,即購買服務器,部署一套系統,支撐公司業務和戰略。此時,IT 只是一項運營成本。
但現在這些企業,尤其是初創公司通過租用云服務的方式,就能獲取 IT 能力。
在中國市場,阿里云就提供這種服務。與此同時,騰訊、百度、電信運營商等紛紛進入這一市場。2015 年中國云計算市場爆發后,多家公司曾以年增長率超過三位數的速度增長。不僅如此,從 2015 年下半年開始,云計算服務商已經將客戶瞄向大型企業和政府機關。
從整體來看,云計算取代舊有 IT 部署模式已成為產業共識,尤其是按需付費的公有云更是對 IT 成本最有效的節省。Gartner 研究報告預計,2017 年到 2020 年公有云行業增速將維持在 15% 以上,2020 年將達到 3834 億美元的規模,而云代替的總規模也將達到 2160 億美元。
一位行業分析師告訴記者,對于如電信、金融等一些關鍵領域的巨頭公司,這類宕機事件仍將是影響其快速轉向云計算隊伍的阻礙,他們可能拿出一些非核心業務在云計算上嘗試,但很難馬上全部轉向云計算。