4大交換機網絡通信故障排除,簡單易上手!
思科交換機一般不容易產生故障,一但產生故障,對于CCNA認證標準的學員通常都不太好檢測和排除。
在本文中總結在交換機使用過程中常出現的一些小故障,以幫助學員通過認證并適應簡單的工作環境。
1. 關于物理層線路連接的故障
物理層線路連接是網絡正常使用的提前,不得不指出,很多時候所謂的網絡故障是因為物理層線路接連所導致。
比如:連接相應桌面計算機的雙絞線連接了錯誤的交換機接口、RJ45連接頭松脫、沒有連接物理線纜等。
在這里需要特別提出的是思科的交換機連接交換機使用交叉雙絞線、交換機與路由器或者計算機相連使用直通雙絞線。
如果您需要交換機在某個接口上進行自適應介質接口,就必須在相關的接口模式下啟動auto-MDIX指令。
auto-MDIX的全稱叫做automatic medium-dependent interface crossover自動介質接口交叉。
當啟動這個功能后,無論接口連接的是哪種類型的線纜,交換機都能自動調節該接口使其保持正常的工作。
啟動auto-MDIX有一個要求:該接口必須能自動協商速率與雙工模式。
2. 關于雙工模式的故障
雙式模式不匹配可能會產生相關的故障。
現今網絡市場上幾乎所有的設備都支持全雙工模式,當然除了傳統的集線器(HUB)設備外,應該讓所有的網絡設備處于全雙式的模式下。
默認情況下,思科建議將交換機的接口配置成自動協商速度與雙工模式。
這樣做的理由是:如果發生一個半雙工的設備去連接思科的交換機。
那么,思科的交換機將把自己的全雙工降級成半雙工模式以適應該設備的運行,如果管理員強制要求交換機接口工作在全雙工模式下,將產生接口錯誤。
排除的依據是使用show interfaces fastEthernet 0/1 counters errors查看接口上的錯誤。
如圖1所示。
3. 關于接口出錯的故障
交換機的接口出錯通常會導致大量的數據幀。
比如:當用戶發現基于TCP的應用變得非常緩慢時,從表面看上去TCP的應用變慢是乎與交換機接口故障無關。
但是進一步思考,TCP變慢的更多原因是由于TCP慢啟動所致,在TCP慢啟動的狀態下TCP的滑動窗口尺寸將變小,而這種現象往往是交換機丟包所致。
在這種狀況下,基于UDP的應用就更可怕,因為UDP根本不會重傳,所以網絡質量將嚴重下降。
所以在排除這種故障時,我們需要知道,交換機為什么丟包,這往往與交換機的接口錯誤有關,必須查看交換機接口的錯誤統計消息。
關于交換機接口的錯誤統計消息,可以通過show interface x/y counters errors來得到如上圖1所示,現在來理解每個錯誤統計器的意義:
- Align-Err(對齊錯誤):如果數據幀不是以偶數個八位組結束就會出現對齊錯誤,指示是物理層差錯,一般是由于布線、交換機接口故障所引發。
- FCS-Err(幀校驗錯誤):幀校驗錯誤,通常也發生在物理層,并伴隨Align-Err現象。
- Xmit-Err(發送錯誤):指示交換機的接口發送緩存溢出,這通常是入站和出站速率不匹配所造成的。
- Rcv-Err(接收錯誤):指示交換機的接口接收緩存溢出,這通常是交換機的背板發生擁塞,導致接收緩存被堆滿。在很多時候接收錯誤也暗示了雙工模式不匹配。
- UnderSize(超短幀):指示校驗和有效,但是幀尺寸小于64字節,這表示連接到該接口的主機正在發送無效的數據幀尺寸。
- Single-Col(單一沖突):指示在該接口成功發送數據幀之前,產生了一次沖突時會發生單一沖突錯誤,產生這種錯誤的原因是鏈路的使用率過高或者雙工不匹配。
- Multi-Col(多次沖突):指示在該接口成功發送數據幀之前,產生了多次沖突時會發生多次沖突錯誤,產生這種錯誤的原因是鏈路的使用率過高或者雙工不匹配。
- Late-Col(后期沖突):指示轉發數據幀以后,才檢測到的沖突,產生這種錯誤的原因是物理介質(比如:線纜)過長、或者雙工不匹配。
- Excess-Col(過載沖突):當數據幀連續遇到16次沖突后會被丟棄,此時就會出現過載沖突錯誤,產生這種錯誤的主要原因是鏈路的使用率過高、雙工不匹配、網絡中的設備特別是半雙工設備太多。
- Carri-Sen(載波偵聽):指示該接口工作在半雙工狀態,根據CSMA/CD的工作原理,在半雙工狀態下發送數據時,需要進行沖突檢測這將增加carri-sen計數器,在全雙工的模式下是不使用CSMA/CD。
- Runts(殘幀):幀的尺寸小于64個字節,而且CRC錯誤,出現殘幀的錯誤一般是由物理層故障或者雙工模式不匹配所導致的。
- Giants(超長幀):幀的尺寸大于1518個字節,通常出現超長幀錯誤是主機NIC故障所導致。
4. 關于交換機CPU的使用率過高的故障
如圖2所示的交換機架構,通常交換機的架構由兩個層面組成:一個控制層面、一個轉發層面。
控制層面負責運行交換機的操作系統,STP、路由協議、維護路由表、執行ACL等,控制層面包括交換機的CPU和內存。
轉發層面包括交換機的轉發邏輯和背板,交換機的轉發邏輯是交換機用于做出轉發決定的硬件,該硬件負責重寫數據幀頭;
而交換機的背板負責物理連接到交換機的端口,它依賴于交換機的體系統架構,數據幀從交換機的入站接口進入,然后轉發給交換機的背板,最后通過出站接口轉發數據幀。
注意在這個過程中控制平面并不直接參與數據幀的轉發操作。
所以在交換機正常工作的情況下,即便是流量轉發的高峰期,交換機的CPU占用率也應該很低,因為它不直接參加流量轉發。
雖然控制層面不直接參與流量轉發,但是由于轉發層面中的轉發邏輯卻來自于控制層面,因為數據幀思轉發與控制層面還是存在一定的間接關系的。
這樣的話,如果控制層面出現持續性的高負載,比如CPU占用率過高,這將影響交換機轉發數據的速率。
所以從交換機的架構來講,控制層面不會影響交換機的性能,但是在故障排除時還必須考慮控制層面的因素。
交換機的轉發邏輯以一個叫做TCAM的專用內存體現,TCAM與交換機的CEF功能相結合,數據轉發的速度將非??臁?/p>
但是一旦轉發邏輯故障,比如:TCAM內存溢出,轉發邏輯將無法轉發流量。
此時將由交換機的CPU來完成轉發流量,這將增加交換機CPU的開銷,轉發能力也會被降低。
或者換一句話來講,如果交換機的CPU占用率過高,這表示交換機已經沒有使用轉發邏輯轉發數據幀,需要及時排查故障。