【博文推薦】Zabbix通過(guò)SNMP監(jiān)控HP服務(wù)器硬件信息
本博文出自51CTO博客sfzhang博主,有任何問(wèn)題請(qǐng)進(jìn)入博主頁(yè)面互動(dòng)討論! 博文地址:http://sfzhang88.blog.51cto.com/4995876/1595211 |
關(guān)于Zabbix監(jiān)控服務(wù)器硬的件信息,Zabbix官方網(wǎng)站沒(méi)有提到這方面的監(jiān)控思路和方法。之前我寫的博文中寫過(guò)關(guān)于HP服務(wù)器硬件監(jiān)控的文章,大致的思路是借助HP管理工具通過(guò)腳本的方式取出硬件的信息,然后以trapper的方式通過(guò)進(jìn)行監(jiān)控,得到好多博友的支持,在此特別感謝。
通過(guò)腳本的方式監(jiān)控服務(wù)器硬件信息,有以下三個(gè)缺點(diǎn):
1) 通過(guò)agent的方式監(jiān)控會(huì)超時(shí),取不到值。
2)通過(guò)trapper的方式需要每臺(tái)機(jī)器添加crontab,部署起來(lái)麻煩。
3)腳本通用性差,只適合Windows機(jī)器。
4)G8的服務(wù)器執(zhí)行管理命令非常慢。
由于通過(guò)腳本監(jiān)控硬件有以上幾個(gè)缺點(diǎn),因此后來(lái)研究了HP代理。通過(guò)HP代理和SNMP監(jiān)控HP服務(wù)器的硬件,需要安裝snmp服務(wù)和HP代理工具。
- #需要安裝的軟件包
- yum install -y net-snmp net-snmp-util
- hpacucli-9.40-12.0.x86_64.rpm
- hp-snmp-agents-9.40-2506.37.rhel6.x86_64.rpm
- hp-health-9.40-1602.44.rhel6.x86_64.rpm
- #SNMP安裝完成后需要修改snmpd.conf的配置文件。
- dlmod cmaX /usr/lib/libcmaX.so
- rwcommunity sfzhang 127.0.0.1 #可讀可寫
- rocommunity public 127.0.0.1 #只讀
- syscontact Root <root@localhost>
- syslocation Shanghai China
- view all included .1 80
- access notConfigGroup "" any noauth exact all none none
- #啟動(dòng)相關(guān)的服務(wù)
- /etc/init.d/hp-snmp-agents start
- /etc/init.d/hp-health start
- /etc/init.d/snmpd start
然后通過(guò)snmpwalk命令測(cè)試是否可以獲取數(shù)據(jù),下面獲取的是HP服務(wù)器各部件的實(shí)際溫度值。
創(chuàng)建監(jiān)控模板,通過(guò)Zabbix Low-level discovery 可以自動(dòng)創(chuàng)建監(jiān)控項(xiàng),觸發(fā)器和圖像。Zabbix官方文檔中LLD支持以下三種監(jiān)控自動(dòng)發(fā)現(xiàn):
1)文件系統(tǒng)自動(dòng)發(fā)現(xiàn)
2)服務(wù)器網(wǎng)卡的自動(dòng)發(fā)現(xiàn)
3)SNMP OID的自動(dòng)發(fā)現(xiàn)
下面通過(guò)第三種方法來(lái)監(jiān)控HP服務(wù)器硬件信息,以SNMP監(jiān)控HP服務(wù)器陣列卡為例子來(lái)說(shuō)明一下實(shí)現(xiàn)原理。
1)首先創(chuàng)建監(jiān)控模板和Applications。
2)點(diǎn)擊模板的discovery->Create discovery rule。
3)創(chuàng)建監(jiān)控項(xiàng)目Create item prototype。HP代理中的MIB信息沒(méi)有被解析成具體的設(shè)備名稱,因此Name中的#SNMPVALUE就是為了區(qū)分多個(gè)設(shè)備名稱,如HardDisk_0_status,HardDisk_1_status表示***個(gè)硬盤和第二個(gè)硬盤的狀態(tài)。
4)創(chuàng)建觸發(fā)器Create trigger prototype。HP服務(wù)器硬盤,陣列卡,邏輯磁盤等的狀態(tài)正常返回值都是2,如果不是2,說(shuō)明有問(wèn)題,觸發(fā)報(bào)警。
5)用同樣的方法可以監(jiān)控HP硬盤的狀態(tài),邏輯磁盤的狀態(tài),風(fēng)扇的狀態(tài),HP各部件的溫度等。
6)下面通過(guò)DDL自動(dòng)發(fā)現(xiàn)服務(wù)器的物理硬盤的監(jiān)控項(xiàng)和觸發(fā)器,有多少個(gè)硬盤就會(huì)有多少個(gè)監(jiān)控項(xiàng)和觸發(fā)器。
7)Link模板到監(jiān)控主機(jī)上面,當(dāng)主機(jī)整列卡有問(wèn)題的時(shí)候會(huì)報(bào)警。
總結(jié):
1)SNMP協(xié)議是通用的,該模板不僅可以監(jiān)控HP Linux機(jī)器,還可以監(jiān)控HP Windows機(jī)器。
2)HP代理常用的OID,其它的還很多,大家去慢慢研究。
HP陣列卡狀態(tài):1.3.6.1.4.1.232.3.2.2.1.1.6
物理磁盤狀態(tài):1.3.6.1.4.1.232.3.2.5.1.1.6
邏輯磁盤狀態(tài):1.3.6.1.4.1.232.3.2.3.1.1.4
HP部件溫度:1.3.6.1.4.1.232.6.2.6.8.1.4
3)Zabbix不僅對(duì)各種操作系統(tǒng),應(yīng)用程序監(jiān)控很好,而且對(duì)服務(wù)器硬件的監(jiān)控也非常棒。