解決虛擬機(jī)遷移五大問(wèn)題(2)
上節(jié)我們介紹了導(dǎo)致虛擬機(jī)遷移失敗的兩個(gè)原因:硬件資源不足以及服務(wù)器硬件不兼容。本文接續(xù)介紹虛擬機(jī)遷移失敗的其他三個(gè)原因以及如何解決。
3.虛擬機(jī)任務(wù)沖突
某些虛擬化任務(wù)需要花費(fèi)相當(dāng)多的時(shí)間才能完成,而且即使在發(fā)生超時(shí)錯(cuò)誤后仍在后臺(tái)運(yùn)行。當(dāng)另一個(gè)虛擬化任務(wù)也在同時(shí)運(yùn)行時(shí)嘗試啟動(dòng)一個(gè)虛擬機(jī)可能會(huì)導(dǎo)致服務(wù)器發(fā)生錯(cuò)誤。例如,當(dāng)你刪除不需要的快照時(shí),在合并過(guò)程中,虛擬機(jī)可能不會(huì)重啟。修改虛擬機(jī)配置文件中的超時(shí)設(shè)置將允許關(guān)鍵的活動(dòng)不間斷運(yùn)行,但是你可能還需要重新配置后臺(tái)任務(wù)來(lái)避免在下班時(shí)間虛擬機(jī)發(fā)生遷移以及重啟。
4.虛擬機(jī)文件損壞
虛擬機(jī)僅僅是運(yùn)行于內(nèi)存中的鏡像,而且該鏡像以特定的虛擬機(jī)文件格式比如.vmx以及.vmdk保存在磁盤中。與所有基于磁盤的存儲(chǔ)一樣,磁盤存儲(chǔ)子系統(tǒng)或者網(wǎng)絡(luò)連接存儲(chǔ)以及服務(wù)器存在的問(wèn)題可能會(huì)破壞虛擬機(jī)文件。當(dāng)虛擬機(jī)所需要的必要文件丟失、被鎖定、損壞時(shí),虛擬機(jī)將無(wú)法啟動(dòng)。
文件鎖定用于避免并發(fā)的任務(wù)對(duì)正在使用的文件帶來(lái)意想不到的變化,經(jīng)常會(huì)發(fā)生上述錯(cuò)誤。在某些情況下,虛擬機(jī)組件文件仍舊被鎖定而且避免了虛擬機(jī)在另一臺(tái)服務(wù)器上啟動(dòng)。你可以修改被鎖定的文件然后移除鎖定,但是這一詳細(xì)的過(guò)程需要具備有關(guān)特定hypervisor以及數(shù)據(jù)中心環(huán)境的專業(yè)知識(shí)。更為常見的是從最近的快照或者另一個(gè)備份恢復(fù)虛擬機(jī)。
5.許可、管理輸入以及其他問(wèn)題
導(dǎo)致虛擬機(jī)無(wú)法啟動(dòng)的其他問(wèn)題與比如用戶輸入意外中斷有關(guān),而與服務(wù)器功能或者文件完整性無(wú)關(guān)。虛擬機(jī)可能開啟了一個(gè)正常以及成功的啟動(dòng)過(guò)程,但是在啟動(dòng)完成之前暫停了,并等待管理輸入。一旦你回答了該問(wèn)題,虛擬機(jī)將會(huì)繼續(xù)啟動(dòng)。在重新配置虛擬機(jī)以自動(dòng)應(yīng)答常規(guī)問(wèn)題、消除人為干預(yù)之前,你需要在虛擬機(jī)啟動(dòng)過(guò)程中避免中斷。這一過(guò)程與hypervisor相關(guān)而且需要具備專業(yè)知識(shí)。
另一個(gè)經(jīng)常被忽略的問(wèn)題是許可,該問(wèn)題通常源于hypervisor安裝疏忽。例如,將虛擬機(jī)部署在一臺(tái)剛被虛擬化的服務(wù)器上時(shí),這臺(tái)新服務(wù)器的許可可能沒有被正確配置。在其他情況下,許可可能被破壞了,或者組織可能就沒有許可。因此,你必須確保有足夠的許可來(lái)支持正在使用的虛擬化服務(wù)器,確保服務(wù)器已經(jīng)配置了許可而且務(wù)必使許可是完整的而且沒有被破壞。
訪問(wèn)hypervisor的日志文件或者管理日志也可能會(huì)加速故障診斷過(guò)程。如果通過(guò)日志沒有找到問(wèn)題,根本原因很可能是上述問(wèn)題中的一個(gè)。