IT企業數據中心管理者如何應對自然災害?
譯文【2013年7月18日 51CTO外電頭條】關于氣候劇變的各種征兆接踵而至,并迫使很多企業領導者及IT專業人士思考這樣一個問題:數據中心管理者要如何應對氣象學家們口中所謂百年一遇甚至五百年一遇的風暴、洪水以及沿岸地區的其它自然災害?
一些專家建議關鍵任務數據中心的管理者們只需簡單對現有設施進行加固,但另一些觀察家們認為數據中心需要被轉移至高地位置,第三種意見則勸說數據中心管理者綜合以上兩種方案。
不過專家們在這一結論上達成了一致:幾乎沒有幾家IT機構有能力在風暴侵襲下全身而退或者僅略受影響--即使是那些長久以來一直籌備應對之策的機構也做不到。大多數IT領導者都希望以成本最低、工作量最少的方式構建災難應對機制。
舉例來說,就東海岸的情況看,各數據中心在對抗颶風桑迪時并未能拿出任何特別有效的措施,PTS數據中心解決方案公司創始人兼總裁Peter Sacco指出--這是一家位于新澤西州富蘭克林湖的數據中心設計及管理咨詢企業。從另一個角度看,他認為目前大部分計算機都已經成為網絡體系中的一部分,而不再強調單一數據中心的重要性。
作為IT基礎設施托管企業,英特奈普公司對風暴過后危險性最高的多套設施進行了加固,包括位于曼哈頓下城區百老匯街75號的建筑。在這場風暴中燃油泵出現故障,英特奈普的員工們不得不將巨大的1200加侖燃油桶運送至樓上,從而保證服務器的電力供應。
“沒人準確預測到桑迪竟會帶來如此巨大的災難,”英特奈普公司開發與運營部門高級副總裁Steve Orchard表示。通過颶風桑迪與2011年的颶風艾琳,“這種趨勢已經給我們敲響了警鐘,”他補充稱。
該公司已經宣布將在新澤西州的斯考克斯市建立新的數據中心--遠離沖積平原。“我們非常重視氣候變化因素,并以此指導自己對新設施的位置選擇,”Orchard解釋道。
背景情況
2005年的颶風卡特里娜與麗塔給我們留下深刻印象,緊隨其后的是2008年的古斯塔夫與艾克,接著是2012年的艾薩克。一波又一波的災難在墨西哥灣沿岸給Entergy公司的IT管理者帶來了巨大壓力。這家市值100億美元、擁有15000名員工的企業最終放棄了在新奧爾良地區建立數據中心的打算。
在卡特里娜出現之前,向280萬客戶提供核能與礦物燃料電能供應的Entergy公司將總部設在新奧爾良,并在路易斯安那州的格雷特納建立起一家數據中心--位于密西西比河與新奧爾良市區之間。
“我們當時獲悉數據中心正好處在風暴前進路線之上,巨大的壓力讓我們在災難結束后旋即做出決定--對數據中心進行遷移,"Entergy公司CIO Jill Israel回憶道。"我們數據中心周邊的區域并未直接受到洪水侵襲,但電力供應已然中斷,外部線路損壞使我們不得不使用備用發電機并關閉了大部分設施。”
2006年冬季,該公司決定在密西西比州的杰克遜市與阿肯色州的小石城建立兩家鏡像數據中心。在小石城方面,該公司對一家歷史悠久的圖書館進行了結構改造,并于2008年陸續將來自新奧爾良的硬件及關鍵性應用遷至這套備份設施當中。
直到2010年,Entergy才最終完成了這套耗資3000萬美元的杰克遜數據中心。該公司需要對兩套設施進行負載平衡,尤其是電子郵件系統。根據Israel的說法,"將應用程序由新奧爾良遷出需要制定一套周密的規劃方案。繼卡特里娜之后,我們已經遭遇過多次嚴重風暴災害,包括小石城遭遇的冰風暴。不過我不希望再被自然之力嚇得心神不寧,"她告訴我們。
該公司每年都會針對颶風及其它類型風暴災害進行演練,從而獲得更出色的應急響應能力。Israel不無自豪地聲稱,“我們很快意識到如何高效將勞動力進行分散非常重要。我們的員工現在能夠以遠程方式處理大量工作,而且其實際效果相當出色。”
不過并非每位管理者都對自然災害保持密切關注。位于歐洲及美國東北部的眾多IT機構似乎堅持認為,超級風暴只是自然界難得一遇的小概率事件。在某些情況下,即使已經受到災害的實際影響,IT管理者仍然表現出嚴重的健忘癥、拒絕對狀況做出積極回應。#p#
無知者無畏
“從傳統角度看堪稱高枕無憂的方案如今很可能面臨威脅,”Gartner公司數據中心及基礎設施分析師Rakesh Kumar指出。他列舉了發生在歐洲地區的凍結溫度、沿岸洪水及其它一些無法預測的氣象變化,并強調了亞洲地區對于海嘯活動的漠視。“直到真正遭遇大規模數據停機事件之前,大部分客戶對于自然災害引發的風險并不關心;他們甚至有點選擇性無視的意味,”Kumar解釋道。
他表示大部分歐洲及美國客戶都樂于進行長期風險評估并采取前瞻性評估機制,至少在理論層面是如此。
即使是在颶風桑迪剛剛過去數個月的今天,大部分東海岸企業仍然沒有組織數據中心遷移的計劃。“他們不僅沒有考慮遷移事項,甚至希望在原有基礎上進一步擴大數據中心規模,”希恩合作公司數據中心架構負責人Neil Sheehan指出--這是一家位于芝加哥的架構企業。
他認為,事實上“我們正在為客戶在新澤西周邊海岸地區制定擴展方案。”Sheehan表示,根據對五百年一遇洪水的水位調查,數據中心架構師可以設計出理想的一層高度從而在災害發生時依靠多層停車場容納積水。
也有不少企業在口頭承諾之外對可能出現的災難做出進一步準備。在曼哈頓下城區西街140號,一家Verizon交換中心也徹底感受了一回颶風桑迪的真正威力。洪水一口氣淹沒了五層地下設施,包括Verizon電纜室。技術人員不得不努力在電梯井處安裝應急發電機與抽水泵。
自災難發生以來,Verizon公司已經從曼哈頓下城區的基礎設施、中央辦公室、總部以及客戶現場中撤出150噸受損銅纜,并利用防水光纜作為替代。“如果大家使用的是光纜,那么即使將其鋪設在浴缸里也不會影響正常使用;光纖材質并不怕水,”Verizon企業解決方案部門全球客戶保障副總裁Chris Kimm表示。
通過更換電力基礎設施并將其提升至較高樓層,這家運營商最終得在一周之后恢復了中央辦公區的正常運作。
不少客戶開始紛紛仿效Verizon的應對之策--將關鍵性基礎設施遷移至封閉化可租用辦公位置。根據Kimm的見聞,有些客戶還會部署一系列新服務,包括移動無線、無線IP以及云計算方案等,借以幫助員工以遠程方式處理日常工作。另一些客戶會重新部署其電信及數據網絡。“我們甚至要求一部分樓宇業主將原本的企業場所改造為住宅環境,并全面部署無線服務,”Kimm指出。
即使遭受了如此嚴重的災害侵襲,Verizon仍然不打算將交換中心遷移至洪水發生頻率更低的位置。相反,Kimm認為“我們正在提高建筑物的抗災能力;我們已經對所有潛在風險做出了評估。盡管目前還沒有制定出最終方案,但……在颶風季節來臨之前,我們還不會遭遇太嚴重的潛在風險。”
經驗教訓
由颶風卡特里娜與颶風桑迪這樣的極端狀況所引發的氣候變化仍然難于計算,氣象學家們甚至無法準備預測終端天氣、海平面及溫度上升的具體情況。不過在美國本土,例如曼哈頓、長島、新澤西、邁阿密、波士頓、華盛頓特區甚至是西雅圖與圣迭戈等地,未來的沿岸洪災很可能會越來越多。
“我認為近年來接二連三的風暴令人無法忽視,統計結果也顯示全球氣候變化及其它因素正引發越來越多的極端天氣狀況,”451研究公司業務連續性與彈性分析師Jim Grogan指出。
“不過每一次自然災害都給我們帶來可資學習的經驗,”他表示。“經驗來自數據中心運營商們為了在最糟糕條件下繼續保持設施運作而做出的創造性及創新性努力。”
盡管桑迪的出現為眾多渾渾噩噩的紐約數據中心運營商敲響了強化基礎設施的警鐘,不過目前尚不清楚多少措施能夠真正成為長效性解決方案--例如徹底脫離城市環境、部署冗余及地理位置彼此獨立的設施或者采用第三方災難恢復及云計算解決方案等。
Grogan同時宣稱,某些大型IT機構正在為數據中心運營尋找備選地點。“亞特蘭大、弗吉尼亞以及其它地區的多租戶數據中心運營商已經意識到客戶將基礎設施向東北部遷移的需求。”
很多有能力負擔災難恢復方案的企業都考慮在主要城市之外使用Cervalis等托管系統供應商的安全多租戶基礎設施。Cervalis是一家IT基礎設施供應商,目前擁有超過兩百家企業客戶,其中包括來自世界各地的銀行及軟件公司。Cervalis在紐約州北部、新澤西州賽克郡以及康涅狄格州的費爾菲爾德郡都擁有占地數十萬平方英尺的多租戶設施,且遠離洪水可能侵襲的區域。
Cervalis提供配備冗余電源的安全機柜,每個機柜能夠容納20到40臺服務器,月使用費在1500美元左右。客戶能夠利用其設施作為主要或次要數據中心,而且根據Cervalis公司營銷、銷售以及業務開發副總裁Zack Margolis的說法,其使用成本低于自主創建冗余設施。
當然,并不是每家企業都有能力負擔起這種級別的保護方案;某些小型運營商可能尚未意識到數據備份的重要性。不過大多數機構將必須尋求以高性價比方案確保業務連續性的方法,例如在小型災難恢復設施中使用虛擬化云或者備份磁帶等。
此外,許多企業仍然決定固守大城市。“曼哈頓的基礎設施需求仍然非常旺盛,這主要是因為曼哈頓在美國本土的互聯樞紐地位所決定,”451研究公司數據中心托管分析師Michael Levy指出。另外,金融企業希望計算設施與交易事務中心盡可能臨近,從而保證數據處理始終被控制在低延遲狀態下。不過這基本是一種誤解,事實上由光纖連通的不同設施即使相距很遠也能帶來理想的延遲狀況。
總體而言,Kumar堅持認為IT領導者在天氣與氣候變化方面采取的處理態度與重視程度還遠遠不夠。“如今氣候變化所引發的沿岸洪澇災害已經成為不容忽視的問題;而在倫敦和德國,冬季的天氣似乎越來越差,少量電氣設備在受凍之后導致嚴重的組件故障。”
盡管鐵一般的事實已經擺在面前,大多數IT管理者仍然拒絕主動做出風險評估以避免災害困擾。“每當Gartner公司談到風險評估,客戶們總會表示‘很好,我們會與工程部門聯系整理出一份報告’”,Kumar告訴我們。“但兩個月之后,事情往往仍沒有任何實質性進展。”
原文鏈接: