Zabbix 5.2由淺入深系列之監控華為交換機(盒式)
看到這個話題,很多人都會有疑問,官方不是提供華為相關的模板么?為什么還需要做?其實從Zabbix官方的這個模板使用效果來看并不是太好,雖說可以滿足大部分需求,但是隨著量的增長,那么無用的指標就會越來越多,如何更加適合的去監控的你交換機,是我們今天的主題
官方模板
正文
官方模板和優化過后的模板對比
下圖為對比圖,這僅僅只是端口級監控項數量已經相差了50倍
目標
在監控之前,需要弄明白一件事情,你到底想監控什么?由于這里是數據中心的盒式交換機,所以我的目標是監控端口、CPU、內存、溫度等指標。
思路
確定了目標,我們就得思考怎么做,首先確定相對應的OID,這個是必備的,其次創建模板、監控項、觸發器、圖形等等,最后優化。
確定OID
由于華為官方提供了相對應的說明,所以很方便,此次模板使用了以下3個mib庫,也就意味著OID都可以在下面3個mib庫找到
必備條件
- Zabbix Server具備snmpwalk工具或圖形化Mib瀏覽器(推薦MIB Browser)
- 交換機SNMP相關設備已經配置好
查詢CPU利用率
1.查詢出所需要的OID
2.用hwEntityCpuUsage查詢交換機CPU利用率,會發現很多值,而且很多值,僅僅只有一個值不為0.
查詢CPU利用率
- SNMPv2-SMI::enterprises.2011.5.25.31.1.1.1.1.5.16842753 = INTEGER: 20
3.查詢這些索引背后代表的監控實體名稱,通過entPhysicalName,需要注意的是,這些索引是一一對應的,因為MIB是一個樹狀結構,所以同一個實體都有CPU、內存等數據。
獲取到名稱
- SNMPv2-SMI::enterprises.2011.5.25.31.1.1.1.1.5.16842753 = INTEGER: 20
- SNMPv2-SMI::mib-2.47.1.1.1.1.7.16842753 = STRING: "CE6855-48S6Q-HI 1"
4.通過上述很輕松就能找到該盒式設備的CPU利用率,但對于新人來講依然覺得會有點難理解,怎么找到的?怎么判斷它是需要被監控的實體,entPhysicalClass給出了答案,9代表設備本身,我們看看結果就清楚了。
entPhysicalClass
只有一個9
到這里大家是否都能明白了?其實監控網絡設備的邏輯就這樣的,獲取到相對應的取值都是通過計算得來的。
創建主機組和模板
創建過程略
創建CPU監控項
通過上一節內容發現,CPU利用率的OID會得出多個值,所以采用自動發現規則的方式去實現監控項。
1.創建自動發現規則
暫時不做任何過濾
2.創建監控項原型
監控項原型
3.創建觸發器原型
觸發器原型
4.創建圖形原型
圖形原型
5調用模板
6.效果
此時會發現有很多沒用的設備,需要添加過濾器
效果圖
7.添加過濾器,添加一個過濾條件{#ENTTYPE},條件為符合9
創建一個過濾值
添加過濾條件,符合為真發,放入監控列表
過濾完剩下一個選項
內存部分
溫度部分
端口部分
端口部分需要注意的是ifHCInOctets和ifInOctets的區別,當流量超過4G時,會出現斷流情況,所以建議采用HC 64位版本即可。其次采集流量的時候,是采集當前端口的累計流量,如果監控流量情況,需要采用預處理動作。
過濾器詳情
自動發現規則詳情
預處理
最終效果
最終效果
出圖正常
寫在最后
由于篇幅有限,無法輸出全部過程,但每一個監控過程基本一致,我會在視頻里詳解,官方的模板其實還是有很多不合理的,特別的超限告警容易出現問題,另外端口UP過濾的在最新的模板已經調整過來了,整個過程需要有耐心去操作,文末是華為官方的查詢工具,可以自行查閱。
尚未完全做好,敬請期待