絕對重口味 機房管理員“死亡筆記”(漫畫)
注意了,聽數據中心管理員講述恐怖的破壞事件,包括鬧鬼設備、僵尸服務器和不死的主機!這些關于數據中心毀滅的故事將會讓你毛骨悚然,特別是那些混亂不堪的布線和那些不見天日的吸血鬼般的系統管理員!
如果你那友好的服務器廠商變成了惡魔的化身你該怎么辦?或者是機房空調(CRACs)像是中了邪似的向冷空道理吹陰森森的淡黃色熱風?閱讀數據中心機房里的這些恐怖、荒誕而又十分真實的故事,并為之做好切實的準備。
#p#
數據中心荒地的怪物們
幾年前,一個年輕的系統工程師參觀了某個潛在客戶的數據中心。在開始做事之前,他只是進行參觀并對設備進行評估,看看能為這個公司做些什么。
很快,他就遇到了一個緊急情況。公司的火警警報響了,而機房的地板上卻有著四英寸深的水。他看見一個古老的似乎來自恐龍時代的開關和一個磁帶備份庫放在一個塑料的推車上,一臺Dell的服務器毫無束縛地擺在那,以及一堆雜亂無章的通訊設備堆在一個木質的桌子上,每個設備仿佛都在發出嘶嘶的召喚聲。更讓我們的英雄恐懼的是,一個以太網交換機和一個粗得像個男人腰的RJ-11纏在一塊,從一個專用分組交換機(PBX)里面伸出來,看起來像是幾十年前用釘子把它們釘進去的。
公司的老板不知道從哪冒了出來,他以為這個年輕的工程師是被叫過來維修的,他一直認為系統可以在一個小時以內開始工作。就在你覺得不知道有多恐怖的時候,剛剛那個把綠光屏終端和服務器收起來的人突然從陰影里走了出來,他大叫,“你不能這樣對待Unix服務器!他們不是Windows服務器,不能這樣直接關掉!”
那時,他接到了一個來自Dell工程師的電話,我們的主人公已經跑得老遠了…在Dell做技術支持真是一件很愉快的事情……
——Carl Brooks
#p#
千萬不要按紅色的按鈕!
那是一個漆黑的暴風雨之夜,哦,不,其實是一個秋天的下午,晴間多云,只是你在室內看不清而已。我們的管理團隊在舒適的B座的辦公室里,而數據中心在A座。
每個人都在津津有味地處理數據,就在這時,與A座的所有通訊突然都終止了。
在打了幾通電話以后,得出了一個結論:整個數據中心宕機了。我們開始絕望地邁向A座數據中心,找出事情的根源。
一個部門的主管和一個新的承包商,推著一臺新的服務器走向機房,準備第二天進行安裝。在放下了這個系統之后,部門主管推著車,承包商打開門,但是,他沒有按那個黑色的大按鈕開門,而按了對面墻壁上的紅色按鈕,按鈕旁邊還很清晰地顯示著“緊急關機”。
這是數據中心最“有效”的整個機房關機方法,也是一次前無古人的經歷,甚至比之前應對艾克颶風的計劃關機還要快。
第二天,那個大紅色的開關臨時被塑膠帶封住了,第二周,一個需要一些步驟才能打開的蓋子蓋住了那個按鈕,標志也換了個比以前更明顯的,用以確保沒有人會在開門的時候按那個按鈕。
——Bill Bradford
#p#
新地熱數據中心計劃
紐約Sleepy Hollow的一個新建數據中心將在10月30號日落時分投入運行,該數據中心完全位于地下,并且完全獨立于當地的電力網,它將會依靠來自地下的地熱能來運行。
不像云計算通訊那樣,網站的用戶需要在連接到互聯網的情況下,通過一個“路由協議”從世界各個地方相連。根據通訊總監Mephispheles描述,顯然,這甚至能夠允許iphone用戶進行連接,不管他們身在和何方。——“哪怕是他們是在地下6英尺”。
數據中心運維人員仍然還在保密,他們都帶著面具,因為這個數據中心是H級的IP地址范圍。但應該指出的是,據伊卡博德起重機停機研究所述,這是出于對第四級設計工作的負責,各種病毒和十六進制的惡意代碼隨時都有可能會進行襲擊。
安全工作將會做得很嚴謹,就像艾爾姆街666號的大門上所寫的,“放棄你進入這里的念頭吧!”此外,還有傳言說,該地點將會由帶著尖頂帽子的女員工來巡邏。
當局人士發出警告說,準備打造了一支“敢死隊”來應對一切不正常事件。
——Julius Neudorfer
#p#
服務器壁櫥里的“骷髏”
一個人數大概100左右的小公司的一個員工要求進行一些服務器升級。當我到達現場的時候,我要求看看數據中心。IT經理告訴我說組織以前有一個很好的房間來放置服務器,但是公司的一個執行官為了擁有一個更大的辦公室,把這個空間給占據了。他的舊辦公室給了他的某個助理。
我讓IT經理告訴我這些服務器放在哪。令我恐懼的是,它們居然被放到了門衛的壁櫥里——一個巨熱而且又不通風的地方。
還有一個更大的問題,其中的兩臺服務器居然放在拖把水槽和墻壁之間的楔形空間里,如果這還不夠糟糕的話,還有更糟的:所有的服務器的電源都插在一個插板上,并且接到一個開關上,每當有人不小心把壁櫥里的燈關掉,就會導致八臺服務器斷電。
——Brien Posey
#p#
來自地獄的系統供應商
你花了100萬美元買了新的機器,又花了好幾百萬元購買必要的增壓軟件。當你看著你的數據庫設備投入運行的時候,你覺得你大功告成了對吧.?
沒那么快!歡迎使用甲骨文的恐怖之屋。Mwhahhahahahahahaha。
由于甲骨文的每年12%的硬件維修費用以及更高的軟件維護費用,你會感覺自己正在走進一個充滿恐懼的世界,而且,不要忘了還有你已經接受的那些更恐怖的軟件和硬件審計,這是一場永無止境的恐怖秀。
#p#
不死的大型機
數十年前,專家們錯誤地預測到大型機將會消亡。下面故事就是關于大型機不能夠生存的例子:
“1974年我在Cornell的時候,我們的數據中心購買了最新的370,”Wayne Kernochan講述道,“但是一件奇怪的事情發生了:突然——每當運行數小時后,沒有任何明顯的原因——370就會停止工作。”
“IBM派出了技術人員,但是他直接沖進了一個磚墻,而不像其他人那樣猛沖直撞;硬件沒有問題,軟件也沒有問題,但是幾個小時后,計算機將會停止工作。IBM公司拿出渾身解數,并且從Colorado工廠帶來了真正的專家。經過了無數次的測試,他們突然注意到一些奇怪的事情,每一次崩潰都發生在某一條微代碼指令之后。平時工作得好好地,但是每一次那條指令之后就會發生崩潰。”
“進一步調查發現,該指令與IBM原來的稍微有些改變。更進一步的調查終于發現,是因為一個Cornell的工程曾經發現了一個能夠讓那條指令運行得更快的方法,因此也能夠提高370 的速度。但是,系統認為的這條指令的運行時間還是不變的,下一條指令需要等一段時間才能運行,因此,這就導致了一個瀑布型的錯誤的計算,最終導致完全崩潰。”
#p#
惡魔般的CRAC(機房空調)單元
你是否經歷過機房空調單元吹出熱風?你是否采取了ASHRAE(美國采暖制冷與空調師協會)提出的新建議——提高進風系統的溫度,并強迫你的管理員坐在熱風通道中?
一個數據中心顧問讓他的一個大客戶把過熱的數據中心里的服務器關掉。“我們告訴他說他需要維修制冷系統,”他回憶說,“第二天,他打電話過來說他的制冷系統維修好了…機房溫度在20攝氏度,服務器還是關著的。我不得不飛到東京去看看到底發生了什么事,我問他們制冷系統做了什么改變。”
“他們把我帶到恒溫器所在的列座,指著穿孔的瓦片說它們從列座的基部對恒溫器進行冷卻,而數據中心的其他部分熱得要命!我感到十分無奈,只好告訴他們入口的溫度才是最重要的,而不是恒溫器的溫度。”
51CTO評論:本文描述了不少數據中心毀滅的情節,但更令小編動容的是其超重口味的畫風。也許讀者看完這些畫面后會有稍許不適,也許ITer們早已習慣這種“口味兒”。通過這“生動”的畫面,數據中心管理員們應該引以為戒了,不要真等到數據中心“死亡”的那一刻來臨!
【編輯推薦】