網絡管理員七大實戰兵法
在多年之網絡管理軟件開發和項目實施中,我接觸了許多之一線工程師,并專門拿出時間和這些每天出入在機房之工程師溝通,收集他們在管理工作中遇到之實際需求,專注于將令其“頭痛”之問題通過SiteView集中解決。
針對各種懸在頭頂之難題,我總結出了網絡管理七大實戰兵法,希望可以給您一些啟發。
第一計:重中之重——關鍵業務流程
需要監測之關鍵業務流程包括:1、單位內部之關鍵業務流程。如項目管理信息系統、生產管理信息系統等。2、網絡吞吐量大之業務流程。主要是一些復雜和交互式之業務流程,資金集中管理系統、公文流轉系統等。3、對系統造成大之壓力,頻繁使用數據庫之業務流程。4、同其它系統集成之業務流程,這些集成會提高應用失敗之風險。
這些業務系統龐大而牽涉面眾多,需要一個綜合業務管理平臺進行整體之監測整合。好之解決方案是引進網管系統,對業務系統是否正常運行、各項具體參數指標是否超標等進行精確掌控,避免或降低業務系統故障之發生率。
第二計:用戶體驗同系統性能指標相關聯
在制定監控策略時,應該考慮將網絡中之所有網絡基礎架構都進行集中監測,包括對數據庫服務器、應用服務器、路由器、交換機、防火墻之監控,從而判斷哪里出了問題導致公司網絡暢通運行。信息服務管理網之網管工程師通過使用SiteView網管工具收集網絡運行信息,將性能數據同單位內部用戶之體驗相結合來分析網絡之性能狀況,診斷系統瓶頸。
第三計:建立網絡運行基準指標并觀察趨勢
長期監測并建立基準指標對于保持網絡和性能之正常性能水平是非常必要之。通過對網絡運行之觀察,運維工程師可以知道網絡性能之變化和流量等指標之運行趨勢;及時發現網絡偏離系統基準模型時之異常狀況,分析是單一故障,還是嚴重問題之前兆,達到預警之目之,防止更嚴重問題之發生。
第四計:設計報警策略,避免警報泛濫
報警是管理網絡和業務系統最重要之功能之一,配置報警之依據是根據信息服務管理網之網絡運維目標,報警設置之原則:1、對影響網絡和業務之重要指標設置報警;2、消除誤報和重復報警;3、報警應該以多種方式及時發送給相應之運維工程師。
第五計:創建自動化、規范化事件處理程序
信息服務管理網運維工程師人員少,日常處理事務較多,他們需要在網絡、鏈路和系統運行出現問題時能夠有自動化、規范化之處理問題程序,快速處理各種潛在故障并且分配他們到合適之管理工程師,幫助他們提高工作效率。建立規范事件處理程序之另一個好處,是將工程師長期積累之知識和工作經驗系統化和固化,達到快速定位故障之目之。
第六計:網絡服務質量SLA之量化管理
提高服務質量之第一步是設立量化指標,將其作為整個網絡運維管理團隊之整體目標。信息服務管理網網絡性能管理之總體目標包括網絡和設備、業務之可用性、網絡之吞吐量、帶寬使用百分比、網絡延時、CPU和MEMORY之負載,對于不同之網絡指標還要根據網絡之上下級連接關系分解到每一個子指標,作為對網絡故障診斷和性能管理之依據。
第七計:制定網絡之升級和改進策略
網絡之升級和改進應該以對現有網絡和系統性能數據之測量為前提,以對網絡整體運行之現狀及趨勢分析為依據。通過對單一網絡系統和整體網絡系統性能數據之比較、單一網絡組件和其它網絡組件之數據比較、系統負載量最大時之性能數據和一般負載時之性能數據之比較等,判斷是否需要對系統之局部或者整體進行升級,發現網絡系統性能之瓶頸,提出網絡系統改進之方法。
【編輯推薦】