科來:能源行業倉庫管理系統故障分析
概述
當用戶發現企業內某些應用系統故障時,多數時候***反應就是網絡出現了故障。網絡管理人員通過常規的手段又不能找到證明網絡正常的證據,也不能定位應用系統故障的原因,這時就需要用到網絡分析類的產品,對鏈路及應用進行長期監控,完整還原故障數據,能夠最快的分析出網絡及應用的故障。
科來回溯分析系統能夠透視網絡流量、分析完整應用會話,從而快速判斷應用故障的根本原因。以下就是通過科來回溯分析系統快速定位業務系統故障的案例。
案例分析
某能源集團倉庫管理系統對整個倉儲環節實施全過程控制管理,倉儲在企業的整個供應鏈中起著至關重要的作用, 但是廠區的內多個用戶能夠通過客戶端打開倉儲管理系統時能夠正常登陸,但在進行查詢庫存量等操作時經常出現“卡死“狀態。嚴重的影響了工作效率。
網絡管理人員通過分析用戶的操作方式、查看防火墻策略、查看交換機工作狀態、更換出現故障的多個用戶線路等多種常規方法,歷時1個多月的時間,最終還是未能確定問題原因。
我們通過在用戶接入交換機上部署科來網絡回溯分析系統,實時抓取用戶訪問倉儲管理系統的流量,分析可能的故障原因。
如上圖,可以說明網絡傳輸效率很好。數據傳輸過程數據傳送也十分迅速,不存在大量丟包的問題。
如上圖,我們定位到發生問題的TCP會話,發現在服務器向客戶端發送完數據之后,客戶端立即向服務器端發送了RST(重置)數據包,中斷了TCP會話。
至此我們基本可以判斷倉庫管理系統故障主要是由客戶端的異常中斷造成的。
找到問題的根源后,我們找到了經常出現問題的幾臺用戶PC,通過完全刪除客戶端程序后重新下載安裝客戶端的方法,徹底解決了倉庫管理系統的的故障現象。
案例總結
由于業務系統情況復雜,可能出現問題的節點較多,使用常規分析手段不能夠快速的找到問題根源,同時增加了很多排障的時間及人力成本。但通過上述案例可以看出,該應用問題困擾了用戶一個月的時間,但通過部署科來網絡回溯分析系統只用了短短幾分鐘的時間就能夠快速找到問題根源,解決了用戶的燃眉之急。