數據中心斷電事故頻發 你的機房真的保險嗎?
如今企業的信息系統已經更多的集中到以數據中心為核心的系統平臺。與此同時,全球化令企業業務規模快速發展,也使得系統平臺更加龐大,所需要處理的數據規模呈現爆炸性增長的需求,企業業務對系統平臺的依賴性與日俱增,這就對以數據中心為核心的系統平臺的可靠性提出了非常高的要求,一旦數據中心有任何閃失,隨之而來的將是收入損失、停產、生產力降低、處罰/訴訟、客戶丟失等有形損失,以及會產生負面效應、客戶不滿、企業信譽降低等無形損失,可謂是牽一發動全身,確保企業業務連續性已經是當今企業最重要的課題。
企業數據中心建設涉及建筑施工、強電、弱電、暖通制冷、網絡、消防、監控、機柜微環境和裝飾裝修等多個工序,幾十個關鍵環節,上千種產品和型號,這些基礎設施還要與上層服務器、存儲和網絡等IT系統進行有機的配合,其復雜性已經遠遠超出了一般企業IT技術人員的能力范圍,沒有高水平的技術人員以及豐富的實踐經驗是沒有辦法應對數據中心高可靠性運營需要的。與此同時,居高不下的運維成本,也使得企業數據中心很難依靠自身的力量管理發展。在這種情況下,越來越多的企業開始把目光投向了那些具有高可用等級的公共數據中心服務,為了與現有IDC數據中心業務進行區分,人們將具有高可用等級的公共數據中心服務稱為EDC。
與IDC業務相比,EDC具有更高級別的數據中心可靠性,具有更加完善的基礎設施平臺,以高效可靠供電為例,EDC會提供雙路市電,外加柴油發電機的供電保護,其中每一路市電均配有N或者N+1的UPS供電保護,如此一來,任何一路市電供電中斷,都不會影響IT系統的供電。即使兩路市電同時中斷,也還有柴油發電機的供電保護,按照設計要求,柴油發電機通常有不低于72小時的油料儲備,同時這些數據中心還與其附件的加油站簽署有油料保障協議,幾乎可以做到萬無一失。
但真的是這樣嗎?我們不幸地看到,不斷有高等級數據中心宕機事件見諸報端,如2011年12月13日,亞馬遜旗下英國、法國、德國和西班牙數據中心宕機超過一個半小時,在過去的幾年時間內,全球***的支付平臺PayPal、Google gmail系統、微軟數據中心、iWeb CL數據中心、Chase.com網上銀行、knocked Intuit網站數據中心均發生過嚴重的宕機事件,有些宕機時間甚至超過了24小時。國內的高等級數據中心也不能夠幸免,有些具有2(N+1)外加柴油發電機的可靠供電保障的數據中心,也一度發生了電力中斷的事件。
談到數據中心高可用性,萬國數據副總裁梁艷表示:"數據中心高可靠性并不僅僅是高等級數據中心設計以及產品設備的簡單堆砌,高投入并不一定帶來高可靠。數據中心的高可用性需要一整套管理的方法論和指標體系,其中,很多需要進行量化。為此,萬國數據創造性地提出了適用性的概念,強調可用性的建設應該圍繞業務發展的需求,通過整合ISO20000、ISO27001、BS25999標準在可用性方面的要求,結合自身多年的實踐,創造了業界首套IT高可用管理體系方法論,從評估、規劃、實施、運行與監控等5個層面實現。同時,通過引入制造業 SOP的管理方式,對數據中心的標準作業進行管理,從而為用戶提供專業化的指導和安全高可用的保障。"
仍以高可靠供電為例,2(N+1)外加柴油發電機的保護只是基礎,還需要高可用的管理體系,依靠運行管理,及時發現系統在運行中的隱患。目前很多數據中心還停留在事后告警的階段,即發生了故障或錯誤提供告警,根本不具備主動式高可用實時監控服務的能力。如果監管水平到位,將可以有效提高數據中心的可用性,避免數據中心中斷給用戶帶來的損失。
對于用戶而言,也需要挑選哪些真正具有高可用等級保障的公共數據中心服務,有些數據中心對外宣傳具有高效可靠供電的保障,設計了2(N+1)外加柴油發電機的 安全保障,但實際上,僅是在某一個特定區域按照2(N+1)設計,用作樣板工程和對外宣傳,這就需要用戶在柴油發電機配置臺數和總功率方面認真加以核算,挑選哪些真正具有高水平的保障的數據中心。