提高Forefront系統容錯性能策略
作為企業級安全防護產品,如果部署之后突然出現故障,使得內網用戶無法訪問互聯網,使企業不想看到的。為此如何提高系統在發生故障時的繼續工作的能力,也是衡量Forefront產品可用性的一個重要方面。實際上Forefront系統容錯性能上提供了許多可圈可點的方法,筆者就借這個機會跟大家分享一下自己在這方面的經驗。
提高Forefront系統容錯性能措施一:單點故障最小化
單點故障最小化,簡單的說,就是如何有效降低單點故障發生的機率。在Forefront產品中,推薦使用都是重復部署硬件設置,來為其提供部分容錯能力,從而實現單點故障最小化的目標。采用這種策略的話,能夠應對大部分的單點故障。如假設現某個數據輸入輸出路徑或者某個服務器的物理硬件組件發生故障,則重復部署的硬件配置能夠讓硬件繼續進行工作。這個原理跟服務器冗余類似。這里只是采用了硬件的冗余策略。
一般來說,用來減少單點故障的硬件根據創建冗余的所使用的組件不同而有所不同。特別是有些比較重視容錯性的廠商,會將重復的硬件部署(硬件冗余方案)作為其可用性的一個重要組成部分。
對于Forefront安全系統(包括安全網關與服務器),筆者建議對于一些比較關鍵的設備盡量采取冗余的策略。特別是對于網卡來說,要使用雙網絡適配器。因為根據筆者的經驗,由于Forefront服務器往往是24小時不間斷的工作,網絡適配器的工作負荷比較大。而且這個設備也比較脆弱,容易受到電壓、雷電等外界因素的影響。平時出現故障的幾率比較高。為此***給Forefront服務器配置穩定性比較高的網絡適配器,并在可能的情況下對其實現冗余,即實現雙網絡適配器配置。
提高Forefront系統容錯性能措施二:有條件的需要電源備份
要讓Forefront長時間的不間斷的提供保護服務,不僅僅軟件自身需要有比較高的穩定性,對于服務器也有這方面的要求。其實大部分管理員都會有這方面的認識。長期運作的穩定性大部分時候關口都在于硬件。也就是說,硬件能否365*24小時不間斷的工作。這對于服務器來說,壓力特別的大。
根據筆者的經驗,在這種長時間運作的情況下,往往電源是***受不了的。這主要是多方面的原因造成的。一方面現在國內的電壓穩定性并不是很高。當電壓上下浮動的頻率過高的話,會對電源產生致命的打擊。如由于用電的關系,大部分企業白天的電壓會比較低,而且隨著大型機械的啟動,上下波動幅度很大。而到了晚上,電壓又會比較高。同時,一年四個季度,也有所差別。如夏天用電負荷大,電壓比較低。同時電壓的變化也比較大。這些因素對于電源會造成比較大的負面影響,大大降低電源的壽命。
為了保護電源,讓其能夠為Forefront服務器不間斷的提供供電,筆者有兩個建議。
一是在服務器層面使用雙電源供電。現在很多品牌的服務器,如IBM服務器,都提供雙電源系統。其實這也是一個硬件的冗余操作。在服務器中部署兩個電源。當其中一個電源出現問題的時候,另外一個電源能夠馬上啟用,向服務器供電。如此的話,就可以避免因為電源出現問題而導致服務器斷電,Forefront系統無法正常工作。同時在必要的情況下,要讓服務器能夠自動報警。即當某個電源不能夠供電的時候,即使告知管理員采取必要的措施,如更換電源。特別是需要查清楚電源損壞的原因。如是電源正常的老化,還是電壓不穩所造成的。如果電壓不穩的話,要及時采取必要的措施,以免下次再次發生這種情況。
二是有條件的企業,要采用UPS不間斷電源。UPS不簡單電源在這里有兩方面的作用,一是UPS電源往往有穩壓的作用。也就是說,通過一定的機制,可以為服務器電源提供比較穩定的電壓。避免外界電壓不穩給電源造成的負面影響。另外一個作用就是可以防止斷電,讓服務器突然當機。由于種種原因,突然斷電的情況在企業中比較常見。如企業可能部署了空氣開關,當某個線路的電荷超過規定負荷的時候,就會自動跳閘,此時就會發生斷電的情況。這不僅會給服務器帶來比較大的負面影響,而且也會導致服務器當機。而UPS通過蓄電池在外界斷電的情況下,仍然可以在一定時間內為服務器持續供電。這可以給管理員留足比較充裕的時間,來進行相關的應急處理。如手工關閉服務器,或者采用后備電源等等。
提高Forefront系統容錯性能措施三:推薦使用RAID磁盤陣列配置
眾所周知,對于服務器的硬盤實現RAID配置的話,能夠帶來很多方面的好處。如可以提升數據的讀取效率,降低磁盤的I/O沖突。在數據庫服務器或者文件服務器中,這已經是推薦的配置。其實RAID磁盤陣列的作用不僅僅表現在這些方面。在容錯能力上也有非常不錯的表現。
對于Forefront服務器來說,筆者就建議采用RAID配置。因為通過使用RAID,可以提高Forefront部署的容錯能力。這主要是因為RAID在多個磁盤上保存相同的數據用于冗余、提高性能并延長平均故障時間。這主要是RAID的特性決定的。因為在RAID配置中,部分物理存儲空間包含硬盤中保存數據的冗余信息。如對于RAID5來說,即使由于某種原因,一塊硬盤出現了物理故障,服務器仍然可以正常使用。因為磁盤陣列系統會根據其他硬盤上的冗余信息來恢復故障硬盤中的數據,從而提高服務器的容錯能力。
為此筆者建議,為了確保Forefront服務器在單個磁盤出現故障的使用仍然能夠正常為企業提供服務,***能夠利用RAID磁盤鏡像或者帶奇偶校驗的磁盤分段來防止單個物理硬盤故障而導致數據丟失。
不過筆者需要提醒的是,RAID配置并不能夠防止文件損壞或者其他文件錯誤。如某個配置文件被意外刪除或者更改,此時RAID不能夠恢復。因為只要其被更改或者刪除之后,相應的信息會寫入到各塊磁盤中。另外,采用RAID只能夠避免單塊硬盤的故障。如服務器中如果同時有兩塊硬盤出現故障(雖然這個幾率并不是很高),此時數據仍然會丟失。因為同時兩塊硬盤出現故障的話,RAID就無法修復故障硬盤上的數據。出于這些方面的考慮,筆者建議在使用RAID的同時,還有必要做好服務器上數據的備份工作。或者說讓RAID與數據備份相輔相成,共同提高Forefront服務器的可用性。
提高Forefront系統容錯性能措施四:學會使用SQLServer日志傳送
數據庫日志傳送則主要從保護數據的層面來提高Forefront的容錯能力。簡單的說,SQLServer日志傳送可以將事務日志從一個數據庫傳送到另外一個數據庫(這個傳送是實時的)。從而當某個數據庫出現故障無法正常使用的時候,另外一個數據庫可以馬上啟用。因為這個數據庫通過日志傳送功能,其內容跟故障的數據庫一模一樣。如此的話,就可以在另一數據庫出現故障時,仍然可以持續的為企業用戶服務。
【編輯推薦】
- Forefront性能優化四步走
- 讓ForeFront TMG來做企業網絡的守門人
- Forefront Security應用程序使用技巧
- 淺談Forefront Security的管理策略和事件
- ForeFront讓郵箱服務器遠離侵襲三建議