系統(tǒng)管理自測(cè)32問(wèn)之15:有關(guān)測(cè)試流程
譯文【51CTO精選譯文】本文是《Limoncelli的測(cè)試:有助于提高系統(tǒng)管理員團(tuán)隊(duì)工作效率的32個(gè)問(wèn)題》當(dāng)中的第15題:在某套方案進(jìn)行大范圍推廣前,有沒(méi)有事先進(jìn)行過(guò)必要的試點(diǎn)?
假設(shè)大家打算對(duì)總計(jì)五百臺(tái)計(jì)算機(jī)設(shè)備部署變更。也許是要更新內(nèi)核,也許只為修復(fù)一個(gè)小bug。
直接對(duì)全部設(shè)備進(jìn)行變更?絕對(duì)不要這樣。大家應(yīng)該先在少數(shù)幾臺(tái)計(jì)算機(jī)上進(jìn)行測(cè)試,看看會(huì)不會(huì)產(chǎn)生意料之外的問(wèn)題。確定一切正常之后再逐步推廣,直到整個(gè)工作徹底完成。
這些用于早期測(cè)試的設(shè)備一般被稱(chēng)為“金絲雀”。
金絲雀作為當(dāng)初煤礦開(kāi)采業(yè)中必不可少的預(yù)警尖兵已經(jīng)成了此類(lèi)早期測(cè)試對(duì)象的代名詞。二十世紀(jì)初葉,美國(guó)及英國(guó)的煤礦工人們?cè)谙戮皶?huì)先將金絲雀放入,以檢測(cè)礦中甲烷及一氧化碳等有毒氣體的濃度。這種小動(dòng)物對(duì)毒氣比人更為敏感,因此能夠及時(shí)警示工人們井下的當(dāng)前有害物質(zhì)狀況,使大家能夠盡早撤離或是立即部署呼吸防護(hù)措施。
以下列舉的是一些常見(jiàn)的金絲雀類(lèi)技術(shù):
個(gè)別、一些、大量:
從一臺(tái)設(shè)備入手(不妨以自己的臺(tái)式機(jī)為起點(diǎn))、接著推廣到數(shù)臺(tái)設(shè)備(同事們的計(jì)算機(jī)該出場(chǎng)了)、***是大范圍部署(逐步增加部署規(guī)模,直到徹底完成)。整個(gè)過(guò)程中出現(xiàn)的任何故障都必須加以重視,馬上停止升級(jí)、取消變更項(xiàng)目且在問(wèn)題完全解決之前不要繼續(xù)嘗試。
計(jì)算機(jī)集群中的金絲雀:
升級(jí)一臺(tái)設(shè)備,接下來(lái)是占總體比重1%的設(shè)備,***以每秒一臺(tái)的速度完成全部工作(主要是針對(duì)像Google這樣擁有大型設(shè)備集群的網(wǎng)站)。
上述流程可以通過(guò)手動(dòng)操作完成,但如果大家使用了配置管理系統(tǒng),那么早期試點(diǎn)功能應(yīng)該已經(jīng)固化在系統(tǒng)當(dāng)中。
【51CTO.com譯文,轉(zhuǎn)載請(qǐng)注明原文作譯者和出處。】
原文:http://everythingsysadmin.com/the-test.html
Limoncelli的測(cè)試:有助于提高系統(tǒng)管理員團(tuán)隊(duì)工作效率的32個(gè)問(wèn)題:
- A.面向公眾的處理方式:
- B. 現(xiàn)代化團(tuán)隊(duì)處理方式:
- *4.你在維基詞條中是否具備獨(dú)特的“策略及流程”類(lèi)說(shuō)明?
- 5.日常所采用的密碼安全性有保障嗎?
- 6.技術(shù)團(tuán)隊(duì)的代碼是否處于源碼控制系統(tǒng)的監(jiān)管之下?
- 7.你的團(tuán)隊(duì)有沒(méi)有使用bug跟蹤系統(tǒng)?
- 8.在你的bug/項(xiàng)目管理方面,穩(wěn)定性問(wèn)題的優(yōu)先級(jí)是否高于新功能?
- 9.你的團(tuán)隊(duì)有堅(jiān)持記錄“設(shè)計(jì)文檔”的習(xí)慣嗎?
- 10.一旦發(fā)生問(wèn)題,有沒(méi)有一套機(jī)制專(zhuān)門(mén)用于記錄故障信息?
- C. 業(yè)務(wù)操作方式:
- D. 自動(dòng)化處理方式:
- E. 團(tuán)隊(duì)管理方式:
- F. 硬件發(fā)生故障時(shí)的處理方式:
- G. 安全性處理方式:
- *28.業(yè)務(wù)中所用到的臺(tái)式機(jī)、筆記本電腦以及服務(wù)器是否運(yùn)行著自動(dòng)更新且無(wú)需確認(rèn)提示的反惡意軟件?
- *29.企業(yè)中是否向員工下發(fā)了書(shū)面的安全性規(guī)章制度?
- 30.你有沒(méi)有對(duì)所有相關(guān)領(lǐng)域進(jìn)行周期性的安全審查?
- 31.是否有相關(guān)機(jī)制允許管理者在一小時(shí)內(nèi)關(guān)閉所有用戶(hù)賬戶(hù)?
- 32.是否有相關(guān)機(jī)制允許管理者在一小時(shí)內(nèi)改變所有特權(quán)(主控)密碼?
【編輯推薦】
- ***社區(qū)Linux服務(wù)器發(fā)行版點(diǎn)評(píng)(生產(chǎn)環(huán)境+測(cè)試環(huán)境)
- 沒(méi)測(cè)試過(guò)的災(zāi)備系統(tǒng)才是企業(yè)最危險(xiǎn)的敵人