Nagios監控Windows 2003服務器的六大注意
前言:很多系統管理員對Windows 2003服務器重視程度不夠,但我目前接觸的金融系統和游戲運維方面,大家都跑的是Windows 2003+SQL server2008,而且效果也比我想象中好;公司的郵件系統和業務平臺也是以Windows 2003(Windows 2003+Exchange2007)為平臺的,如果服務器發生crash情況,會給公司帶來直接經濟損失。
以下注意事項為工作經歷和項目實施中的總結,詳細如下:
①Windows 2003的客戶端的12489端口必須開放,這點可以在Windows 2003用命令netstat -an觀察,注意Windows 2003的主機防火墻及服務器前端的硬件防火墻,這里有個小技巧,你可以在nagios服務器上telnet windows服務器的12489端口,失敗了系統會提示:
正在連接到locahost...不能打開主機的連接,在端口12489:連接失敗;成功了就是黑屏,這個很容易區分;
②[Setting]項的語法跟samba類似,如果allowed_hosts=為空的話,表示客戶機能被任意地址的nagios服務器監控,如果此處設定IP的話,表示只允許此類IP,而禁止其它IP;
③注意服務器和客戶端的密碼不符問題,出現上述問題應該是首先檢查此步;
④公司原先的Nagios監控服務器置于機房內部,老是出現could not fetch information from server的問題,搞得外網區一片黃色;google和baidu了很長時間都沒解決,后來在windows客戶端發現大量報錯日志nsclient.log:unauthorized access from 219.140.245.21,這個IP根本不是我的監控服務器的ip啊,后來發現這個地址是我的Nagios出去的ADSL地址,在發出消息時有大量阻 塞;跟公司的網絡工程師一起分析發現,由于公司的服務器采用的海蜘蛛DMZ映射,外接ADSL+鐵通光纖雙線的網絡環境,很多時候Nagios服務器的地 址并非固定;將其遷移至電信IDC機房后,此問題徹底解決;建議要布署Nagios監控環境的同志要么選擇電信,要么選擇雙線機房吧。故障截圖如下,出現 此現象的哥哥們估計跟我一樣郁悶了:
⑤注意語法方面的錯誤,windows監控機里的nsc.ini中,[Setting]選項中allowed_host,很多文檔都寫成了allowd_hosts,這個是錯誤的;我建議用標準寫法allowed_hosts,如果有多個nagios服務器ip,之間用逗號隔開。以下摘錄nagios3.0的官方說明文檔:Uncomment the 'allowed_hosts' option in the [Settings] section. Add the IP address of the Nagios server to this line, or leave it blank to allow all hosts to connect。
⑥如果出現以上報錯,多關注下windows監控機的nsclient.log日志文件,從里面找出錯的原因;另外,nagios服務器本身也有日志,路徑名為/usr/local/nagios/var/nagios.log。
※這里值得一說的,蠻多系統管理員對Windows 2003服務器重視程度不夠,但我目前接觸的金融系統和游戲運維方面,大家都跑的是 Windows 2003+SQL server2008,而且效果也比我想象中好;公司的郵件系統和業務平臺也是以 Windows 2003(Windows 2003+Exchange2007)為平臺的,如果服務器發生crash情況,會給公司帶來直接經濟損失,這也 是我為什么花精力在Windows 2003監控的原因之一,希望此篇文章能給大家的系統運維帶來幫助。
原文出處:http://hi.baidu.com/yuhongchun027/blog/item/7c27612ba87297ebe6cd40a3.html
【編輯推薦】