數(shù)據(jù)中心的運維管理六大原則
“三分技術,七分管理”。大量的事實表明,數(shù)據(jù)中心的好與差評判標準都是由管理水平的高低所決定的。一個數(shù)據(jù)中心即便采用了***的技術,或者擁有上萬臺服務器,數(shù)百名技術專家,也不一定是一個好的數(shù)據(jù)中心。一個好的數(shù)據(jù)中心會利用本身現(xiàn)有的技術和設備,向用戶提供服務,將運維成本降到***,而使利潤***化。而現(xiàn)有的數(shù)據(jù)中心往往都采用粗獷式管理方式,業(yè)務分散,有些資源不夠用,而有些資源又處于閑置,資源之間無法均衡,數(shù)據(jù)中心的運維成本一般會占到總運營成本的12%以上,這樣的數(shù)據(jù)中心將成為企業(yè)的沉重負擔。現(xiàn)有的數(shù)據(jù)中心在負載均衡,災難恢復,數(shù)據(jù)流分析,資源占用分析等方面的問題都漸漸凸顯出了數(shù)據(jù)中心管理上的不足。想要管理好數(shù)據(jù)中心,讓數(shù)據(jù)中心高效地運行,我們要遵循數(shù)據(jù)中心管理的六大原則。
原則一:機房乃立業(yè)營運之本,承載數(shù)據(jù)中心之搖籃。
機房是數(shù)據(jù)中心運營的依托主體,沒有機房何談數(shù)據(jù)中心,因此數(shù)據(jù)中心的絕大部分工作都是圍繞數(shù)據(jù)機房展開的。作為數(shù)據(jù)中心機房,它要具有基本的運營能力和抵抗災害的能力。對機房進行管理和優(yōu)化,是數(shù)據(jù)中心開展一切工作的基本。具體來講,機房一般包括: 配電系統(tǒng)、防雷接地系統(tǒng)、綜合布線系統(tǒng)、消防系統(tǒng)、門禁系統(tǒng)、空調系統(tǒng)、人員考勤系統(tǒng)等等。在日常管理中,要對這些系統(tǒng)的運營狀況進行監(jiān)控,有隱患及時排除,有缺陷及時優(yōu)化,確保不影響數(shù)據(jù)中心的正常運營。
原則二:以“數(shù)據(jù)服務”為核心,方顯數(shù)據(jù)中心應用本色。
數(shù)據(jù)中心運營的關鍵是要向外提供各種各樣的數(shù)據(jù)服務,這些服務才是數(shù)據(jù)中心利潤的來源,數(shù)據(jù)中心的所有工作都是為了保障向外提供更多服務。數(shù)據(jù)中心內的各種設備,如:存儲、網(wǎng)絡、服務器、應用軟件、防火墻等等,要加強對這些設備和軟件的管理,確保向外提供穩(wěn)定的數(shù)據(jù)服務。隨著信息技術的不斷發(fā)展,數(shù)據(jù)中心也應該不斷引入新的技術,新的服務形式,跟隨信息技術變革的潮流,源源不斷地提供越來越豐富的數(shù)據(jù)服務。讓數(shù)據(jù)中心持續(xù)保持旺盛的生命力。
原則三:安而不忘危,治而不忘亂,存而不忘亡。
人要居安思危,方能立于不敗之地。對數(shù)據(jù)中心管理也要時刻保持有一種危機感。華為在十年前就高喊冬天來了,狼來了,結果換來了十年的高速發(fā)展,雖然已經(jīng)成為世界***的通信設備商,仍在喊嚴冬依然沒有過去,要員工做好長期艱苦奮斗的準備。數(shù)據(jù)中心的管理人員要有這種危機感、使命感,在數(shù)據(jù)中心穩(wěn)定運行的時候,也要時刻保持警惕,防止意外發(fā)生,小心駛得萬年船。在日常管理中,要做足預防工作,避免危險出現(xiàn)。經(jīng)常進行模擬故障演習,比如:業(yè)務切換、設備倒換、部分設備斷電等等操作,確保業(yè)務不中斷。對數(shù)據(jù)中心的日常運營、未來發(fā)展做好規(guī)劃。讓數(shù)據(jù)中心穩(wěn)定、快速的向前發(fā)展。
原則四:明者遠見于未萌,而智者避危于無形。
數(shù)據(jù)中心里危機四伏,任何一個沒有注意的隱患都可能引發(fā)故障。試想想如果一個數(shù)據(jù)中心有數(shù)十萬的服務器設備,那么幾乎每天都會有設備故障,要保證這些故障不影響到數(shù)據(jù)中心的業(yè)務,就需要做好預案,一旦發(fā)生這些故障,數(shù)據(jù)中心該如何切換業(yè)務,確保業(yè)務穩(wěn)定。在數(shù)據(jù)中心日常管理中,要及時發(fā)現(xiàn)故障隱患,將危險扼殺在搖籃之中,亡羊補牢,悔之晚矣。所以能在危險暴露之前就消除,付出的代價最小。
原則五:建設循規(guī)蹈矩,質量重于泰山。
和生產一款產品一樣,數(shù)據(jù)中心的建設和運維質量同樣重要。數(shù)據(jù)中心建設質量的好壞,關系到數(shù)據(jù)中心運行生命周期的長短。從數(shù)據(jù)中心建筑建設、設備采購、改造等都要主抓質量,并不是所有的地方都要用貴的設備和材料,前期一定要做好審核,尤其是關鍵部件,質量一定要過硬。建筑避免豆腐渣工程,采購的設備性價比要高。《圣經(jīng)》中曾記載一個這樣的故事:巴比倫國王尼布加尼撒夢見一個巨大雕像,頭是金的,胸和腎是銀的,腹和腰是銅的,腿是鐵的,但腳是半鐵半泥的。這樣的雕像看似巨人,足卻是泥捏的,一推即倒。數(shù)據(jù)中心的質量也一樣,不能放過任何一個環(huán)節(jié),否則數(shù)據(jù)中心就可能成為泥足巨人。主抓質量往往意味著成本的增加,但帶來的將是長久的穩(wěn)定。
原則六:運維管理無小事,節(jié)能增效保平安。
隨著數(shù)據(jù)中心容量的增加、規(guī)模的擴大以及新型設備與技術的引入,數(shù)據(jù)中心運行與維護的難度也在加大,但仍不能放松心態(tài),運維管理無小事,一旦出現(xiàn)問題,帶來的損失不可想象。運維工作作為數(shù)據(jù)中心生命周期中最長、最重要的階段,應該作為長期的管理工作來抓。在確保數(shù)據(jù)中心穩(wěn)定運維的同時,要關注數(shù)據(jù)中心的節(jié)能。現(xiàn)在的數(shù)據(jù)中心能耗過大,已經(jīng)引起了數(shù)據(jù)中心管理者的關注。在中國,政府的能源開銷,每年大約110億美元,其中來自IT設備的就占到了50%,并且每年還在以8~10%的速度在增長,這樣的數(shù)據(jù)不得不讓政府推出一系列節(jié)能減排的政策。我國信息化基礎設施非常先進,已經(jīng)基本與發(fā)達國家同步,特別是上網(wǎng)用戶已經(jīng)躍居***。龐大的信息需求引發(fā)了海量的數(shù)據(jù)中心建設,某著名的互聯(lián)網(wǎng)企業(yè)規(guī)劃建設一個巨型數(shù)據(jù)中心,可容納15萬臺服務器,設計用電量約60MW,已經(jīng)相當于一個中型發(fā)電廠的總功率。數(shù)據(jù)中心已經(jīng)成為用電量增長最快的行業(yè),龐大的數(shù)據(jù)中心數(shù)量和規(guī)模,已經(jīng)讓電力工業(yè)不堪重負,數(shù)據(jù)中心理應走在節(jié)能的前列,提升數(shù)據(jù)中心運營能效。
無論如何,提高數(shù)據(jù)中心性能、降低數(shù)據(jù)中心能耗、降低數(shù)據(jù)中心運維成本始終是數(shù)據(jù)中心管理人員的***目標。通過深入地理解數(shù)據(jù)中心管理的六大原則,將使得數(shù)據(jù)中心管理工作變得簡單,有效。