交換機配置不當癥狀及其解決的技巧
交換機配置不當癥狀及其解決的技巧,交換機配置不良使得網絡性能劣化。朋友向我推薦的交換機配置不當癥狀,不知道哪一個更適合我,希望廣大網友給我一些建議,***是那些體驗過的網友的建議,謝謝。
交換機配置不當癥狀
某網站IT經理顧先生是我們的老朋友了,三年前在Cisco大會上認識,彼此“情投意合”,“兄弟”幾個經常在一起交流一些網民心得。他原先在一家國有大型企業中任信息中心主任,負責網絡的規劃、設計建設和管理維護事宜。
有好長一段時間沒有他的消息,免費的信箱失效,加之后來換了工作就失去了聯系。正思量怎么設法跟他重新取得聯絡,沒想到他卻不請自到,來了個“自投羅網”,昨天他因網絡問題來網絡醫院咨詢時方知其現在已經辭職到了現在的網站。
顧不上仔細詢問對方的近況,他便直接進入主題:顧先生所負責的網站最近出現一些問題。白天時常會出現短暫的擁塞,上網用戶反映訪問購物頻道之網上在線商城時經常點擊無效,多次重復后仍沒有任何反應。
此現象已經持續的兩周,網站老總責令他必須在兩天內找出原因,解決用戶無法點擊購物的問題,否則……故障出現在什么時候?一般是白天,晚上基本不出現。何時開始出現故障征兆的?沒有什么征兆,突然出現又突然消失,很不穩定且沒有什么規律。那么從***次故障現象出現到今天為止有多久了?就兩周。
兩周前你們對網絡干了什么?比如調整網絡結構、增加或刪除網絡設備、增加服務器、增刪和更改網絡用戶等?沒有。不過網站內容到是幾乎天天在變,但這應該不會有什么影響。因為我們裝有網管系統,可以隨時查看網絡個鏈路的流量狀態。
對鏈路的流量還分別設置了門限報警,如果出現流量異常值班人員會馬上知道。再說,我們的內部網都是用的100Mbps的網卡,核心交換機使用千兆以太網連接。而網站出口只是8Mbps,出問題時檢查過出口流量,從來就沒有超過2Mbps,還不如不出故障時的訪問流量大。
因此,說由于出口瓶頸的原因在訪問流量大造成訪問困難顯然是站不住腳的。對網上商場的服務器仔細檢查并用備用服務器試著更換過,但沒有任何作用。該用的辦法都用過了,實在查不出問題出在哪里。
有沒有做過捕包分析或延遲分析?做過,首先對有關的服務鏈路進行網管監察,發現鏈路流量一般只有5%左右,捕包分析發現出現故障是有較大延遲,但Ping包正常。當時試驗在故障時在網站內任選一臺工作站從網上商城服務器拷貝一個1000M的文件,拷貝速度很快。用協議分析儀的專家診斷系統對捕獲的包進行分析,除了發現HSRP協議幀有3000個,其它未見異常。
交換機配置不當診斷過程
三刻鐘后,我們隨顧先生來到該網站所在大廈。準備著手進行檢查。分析故障現象,指示網絡主要的問題是訪問某個指定的服務器時慢。一般的原因主要有:服務器資源不足,比如接口速度低、CPU速度低、內存不夠、開通的應用窗口過多等。
訪問通道出現瓶頸,訪問速度受限;通道上的設備出現處理延遲,影響通道訪問的速度等。從內部網的反應看,拷貝文件的延遲很小,速度正常。基本說明網站的內部網絡應該沒有大問題。
為了確認訪問通道上的是否有流量瓶頸或延遲超長,我們將網絡故障一點通接入路由器的出口,將網絡綜合協議分析儀OptiView接入在線商城服務器通道。從路由器出發送50Mbps(50%)高流量Ping包指向OptiView,這種方法是為了檢查該通道的通道能力。
可以看到***的通道能力是95Mbps(發送的流量相應的流量加上為95Mbps),將流量幀改為一般的IP幀,無須服務器響應,流量仍為50%,此時安裝在服務器鏈路中的OptiView收到的流量是50Mbps,說明網絡一點通發送的50Mbps的流量已經全部“安全抵達”服務器。
此時的網絡狀態非常“正常”。從OptiView測試對路由器Ping包的響應,顯示時間為12微秒(0.012ms),結論:此時此刻網絡工作正常。由于是不穩定出現的“軟故障”,接下來我們需要在故障出現時進行測試,好在該故障每天白天都會出現,不怕它不來。
50分鐘后,從外線來的電話報告“故障出現”。我們迅速用OptiView的移動網管查看該通道的流量狀態,顯示均小于10%,從OptiView上對網站的路由器做Ping檢查,時間是1200ms。立即從OptiView發送50Mbps流量給網絡一點通,報告收到的流量只有5M,看來不光45M的流量被通道給“濾除”了,而且還引入了很大延遲。
檢查網站的拓撲圖,從圖上標注的狀況來看該訪問通道應該都是100Mbps的以太網鏈路,中間經過5臺交換機到達服務器。在OptiView上對路由器做路徑“TraceSwitch”檢查。結果顯示路徑已經改變!整個路徑中多出了3臺交換機,從而使得原來需要經過5臺交換機就能到達服務器的訪問包現在需要經過8臺交換機才能到達服務器!
追蹤查看這3臺交換機,發現相應鏈路端口工作狀態都是100Mbps。逐級檢查延遲響應時間,發現1200ms的延遲就出現在新增加的***臺交換機通道節點上。由于有備份交換機,為了縮短交換機配置不當故障診斷時間,試著更換此交換機。10分鐘后,交換機更換完畢,開機試驗,故障現象消失。繼續監測至下午收工時間,故障均未再出現。