如何確保vSphere高可用性
配置vSphere集群時一個最重要的特性就是vSphere高可用性,當服務器或者操作系發(fā)生故障時,可以在其他可用的主機上重啟虛擬機。
只有系統(tǒng)管理員針對環(huán)境恰當?shù)嘏渲胿Sphere高可用性(HA)后,虛擬安全機制才能發(fā)揮其作用。通過合理的配置,vSphere HA可以提高vSphere集群中所有虛擬機的可用性。需要保證以下幾個方面配置正確,才可以避免產(chǎn)生宕機。
正確配置接入控制策略
啟用HA后,就可以配置接入控制策略(ACP)了。這個特性允許你設定故障轉(zhuǎn)移過程中使用的資源數(shù)量。在故障轉(zhuǎn)移過程中如果集群中沒有足夠的資源,ACP就會阻止虛擬機(VM)重新啟動。在改變配置之前,需要注意集群當中主機的配置和可承受失效主機的最大數(shù)量。
接入控制策略中有三個選項。
第一個接入控制策略選項定義了可以接受的失效主機的最大數(shù)量。當計算一個虛擬機是否能夠重啟時,HA會假設發(fā)生了最大規(guī)模的主機宕機。
第二個接入控制策略選項定義了集群中CPU和內(nèi)存資源的預留比例。在復雜的主機環(huán)境當中,其可以控制預留多少資源。
第三個接入控制策略選項指定預留哪些主機用于故障轉(zhuǎn)移。為了保證當故障發(fā)生時有足夠的資源,HA會在主機上禁止啟動虛擬機。
正確配置主機隔離響應
新的主機必須能夠鎖定虛擬機的虛擬磁盤文件,HA才能夠重新啟動虛擬機。如果之前的主機仍然可以進行操作,那么虛擬磁盤文件將會被鎖定,阻止新的主機啟動虛擬機。為了防止這種現(xiàn)象發(fā)生,HA中的設定可以定義當一個主機和其他集群節(jié)點處于隔離狀態(tài)時,其可以接受的響應類型。這個設定可以用于關閉、斷電或者保持虛擬機的供電狀態(tài)。必須設定默認狀態(tài),但是每個虛擬機都可以進行單獨配置。
如何避免主機隔離
一些設定可以防止主機宣告自己處于隔離狀態(tài)。
第一個選項是指定一個隔離地址。HA將會嘗試ping這個地址,以決定主機是否已經(jīng)斷開。默認情況下,使用主機上的默認網(wǎng)關作為隔離地址。如果HA運行在一些子網(wǎng)而不是默認網(wǎng)關上,就要使用高級命令das.isolationaddress來配置另外的隔離地址。
第二個選項是正確配置HA使用的網(wǎng)絡。所有的非vMotion VMkernel端口都要用于集群中主機間的HA通訊。對于單一VMkernel端口或者多VMkernel端口來說,配置恰當?shù)木W(wǎng)絡接口卡(NIC)和交換機冗余非常關鍵。
在維護期間禁用主機監(jiān)控。這樣可以防止因為任何影響HA端口或其他HA組件的臨時情況而導致虛擬機意外重啟。除此之外,VMware建議在發(fā)生網(wǎng)絡改變時將主機設定為維護模式,當退出維護模式時強制HA承認任何網(wǎng)絡改動。
確保HA主機監(jiān)控啟用。當建立集群或者結(jié)束維護時忘記檢查集群屬性復選框時,可能會發(fā)生這種情況。并且一些用戶并不相信虛擬環(huán)境中的自動化,所以不啟用它們。