講述:一個(gè)VMware維護(hù)人員每天、每周及每月的工作
有時(shí),VMware管理員如走過(guò)場(chǎng)一樣執(zhí)行日常維護(hù)任務(wù)。他們做X、檢查Y然后把把Z的脈搏。但是很重要的一點(diǎn)是要弄明白這么做的目的。
維護(hù)工作不僅僅是要維持系統(tǒng)在線,它同樣保證您可以從現(xiàn)有投資中獲得最大收益。雖然ESX、vSphere、vCenter和Workstation都是成熟和穩(wěn)定的虛擬化技術(shù),但是它們依然需要進(jìn)行日常維護(hù)。
花費(fèi)一些時(shí)間去了解您的架構(gòu),然后制定VMware維護(hù)計(jì)劃以滿足您的SLA(service level agreement)級(jí)別并盡量減少工作壓力。下面的綱要中包含了一些最佳實(shí)踐,但是每個(gè)虛擬化架構(gòu)各有不同,您需要選擇最適合的方式。
VMware維護(hù)工作根據(jù)頻率可以大致分解為:每天、每周和每月。
VMware日常維護(hù)工作
我每天要進(jìn)行的維護(hù)工作如下:
◇ 查看報(bào)警郵件。郵箱監(jiān)控是一種持續(xù)的、被動(dòng)的、而且一旦正確設(shè)置后不需花費(fèi)很多精力的監(jiān)控方式。當(dāng)您逐漸熟悉系統(tǒng)架構(gòu)后,還可以區(qū)分出警報(bào)的不同類(lèi)型,識(shí)別哪些是緊急的需要立即處理,哪些是需要逐步去改變的。
假設(shè)某個(gè)特定的數(shù)據(jù)庫(kù)在每天的固定時(shí)間發(fā)送CPU占用率過(guò)高的警報(bào),那么最好調(diào)節(jié)一下報(bào)警設(shè)置的條件和頻率。不要忘了《狼來(lái)了》的故事,避免因?yàn)檫^(guò)多無(wú)關(guān)緊要的警報(bào)而忽略了那些關(guān)鍵問(wèn)題。
◇ 巡視服務(wù)器所在的房間。雖然我也設(shè)置了警報(bào),但通過(guò)對(duì)主機(jī)所在的房間進(jìn)行一次快速的巡視我可以馬上判斷出發(fā)生了什么,這非常有用,尤其是忽略了某個(gè)警報(bào)的時(shí)候可以補(bǔ)救。
所有的風(fēng)扇都在運(yùn)行嗎?是否出現(xiàn)內(nèi)存差錯(cuò)?SAN系統(tǒng)中的磁盤(pán)驅(qū)動(dòng)器正常嗎?通過(guò)觀察硬件上的指示燈我可以獲得基本的狀態(tài)信息。我還會(huì)快速檢查一下不間斷電源的供電電壓,以及現(xiàn)在的運(yùn)行時(shí)間。知道了這些,一旦發(fā)生災(zāi)難,我可以知道有多少時(shí)間可用來(lái)關(guān)閉設(shè)備。除了這些快速觀察外,我還經(jīng)常使用HP公司在宿主機(jī)上集成的Lights-Out端口來(lái)檢測(cè)硬件狀態(tài)和溫度,尤其在沒(méi)有物理登陸宿主機(jī)或SAN的時(shí)候,這么做非常有必要。
◇ 環(huán)視一圈vCenter/VirtualCenter。我會(huì)執(zhí)行所有還未完成的任務(wù),瞥一眼ESX主機(jī)的性能然后感受一下各個(gè)組件是否正常。當(dāng)您對(duì)系統(tǒng)每天的性能表現(xiàn)足夠熟悉的時(shí)候,就很容易看出問(wèn)題。相信我,無(wú)論系統(tǒng)看起來(lái)多么協(xié)調(diào),在某些時(shí)候都會(huì)出現(xiàn)問(wèn)題。這個(gè)過(guò)程如同您很熟悉自己在靜止時(shí)的心跳,同時(shí)還需要通過(guò)跑步機(jī)或騎自行車(chē)來(lái)定期檢驗(yàn)一下。
VMware每周維護(hù)工作
每周我會(huì)執(zhí)行如下動(dòng)作:
◇ 備份vCenter/VirtualCenter數(shù)據(jù)庫(kù)。我的現(xiàn)有系統(tǒng)變化不太頻繁,因此一周執(zhí)行一次數(shù)據(jù)庫(kù)清理和管理服務(wù)器的全備份就可以了。如果您的系統(tǒng)處于不斷地動(dòng)態(tài)變化中,可以頻率高一些。依然要強(qiáng)調(diào)那個(gè)老問(wèn)題:如果您希望將來(lái)可以重建,擁有數(shù)據(jù)庫(kù)的備份很重要。
VMware每月維護(hù)工作
每月我們進(jìn)行如下的管理行為:
◇ 清理存儲(chǔ)。如果存在過(guò)期的快照,最好盡快清理掉。如果無(wú)法確定是否存在,可以通過(guò)VMware SiteSurvey查看。
◇ 檢查服務(wù)協(xié)議。您是否已經(jīng)升級(jí)了售后服務(wù)?到了做新的預(yù)算來(lái)購(gòu)買(mǎi)所需支持服務(wù)的時(shí)候了嗎?
◇ 預(yù)想將來(lái)要做的升級(jí)。目前為止,所有的工作都在圍繞保持系統(tǒng)正常工作上。讓我們向后一步,閉上眼睛不妨從相反的角度來(lái)考慮:您希望系統(tǒng)如何工作?怎樣可以改善業(yè)務(wù)?然后找出一條正確的路來(lái)實(shí)現(xiàn)。這聽(tīng)起來(lái)像在做白日夢(mèng),不過(guò)或許這會(huì)成為您一天中最高效的一段時(shí)間。
【編輯推薦】