正確安裝交換機位置 避免交換機網絡故障
很多使用交換機的用戶都遇到過很多問題,原因有很多,這里我們主要分析了由于交換機的位置安裝錯誤,而出現的交換機網絡故障。交換機是局域網中非常關鍵的連接設備,具有一定規模的局域網其交換機的不僅數量多,而且牌子也會比較雜。在這樣的網絡環境中,管理員要根據交換機的性能和其特性合理進行部署,因為您的不當部署會在后期的網絡運維中埋下隱患。筆者和大家分享一個由于安裝位置不當引發交換機網絡故障的案例,希望對您有所幫助。
1.交換機網絡故障現象
某中學的計算機房在一次計算機上機考模擬考試中出現了一個非常奇怪的故障現象:當學生在做模擬考試試題時,各客戶端電腦頻繁出現與服務器的網絡連接中斷的情況。但在出現故障時,每一臺客戶端電腦都能PING通服務器,時延小于10ms,只是從網上鄰居里看不到服務器,并且故障出現時每一臺客戶端電腦又都能通過網上鄰居互相訪問。由于學生的最終模擬考試文件在本地機上操作后,都要保存在服務器上,此交換機網絡故障導致該次模擬考試無法正常進行。
2.初步分析,與服務器無關
經過觀察,發現故障是在訪問服務器的學生數增加的情況下出現.于是開始時將故障點定位在服務器上,初步考慮可能服務器上的連接數設置有問題。在安裝該服務器時,其連接數設置為999,而其他機房正常工作的服務器連接數設置的是256。是否連接數設置過大失效導致故障呢?于是我們將連接數依次降為512、256,重啟服務器后故障依舊。根據實驗結果.排除了連接數設置造成故障的假設。所使用的IBMX3600服務器是新買的,因此又懷疑故障是新設備與安裝的考試系統有沖突造成的。于是馬上搬來另一臺備用服務器IBMX236,該型號服務器在另一實驗室能正常使用.但當換上備用服務器后,故障依舊。至此,初步判斷該故障與服務器無關。
3.定位故障源,問題出在一臺交換機上
那么問題究竟出在哪兒?在這個局域網中除網線外只有3種設備:電腦、服務器和交換機。根據已經做過的測試,客戶端電腦和服務器故障已經排除,PING能夠連通說明網線也沒有問題。于是考慮故障是否由交換機引起。實驗室共有兩種型號的交換機在使用,分別是神州數碼的網易通DCS 2026和H3C S1024R交換機。為確定故障點,將實驗室的20臺客戶端電腦和IBMX3600服務器全部接在了一臺交換機上。首先對H3C S1024R交換機做了測試.在20臺客戶端電腦長PING服務器連通的情況下,同時向服務器上進行試題存盤操作,故障沒有出現。接著將這20臺電腦又接人到神州數碼網易通DCS 2026交換機上,當在第15臺客戶端電腦向服務器存盤時,故障重現,由此初步判定這種故障原因出在交換機上。
4.數據測試,深入分析
為什么DCS 2026的交換機會引發網絡故障呢?我們決定進行數據測試,為使測試結果更有說服務力,大家找來第3個廠家CISCO的355交換機,在同樣的環境下再做測試。在測試過程中,首先保持測試的連線環境不變,三種類型的交換機都采用出廠缺省設置,在每臺客戶端電腦上準備了大小為845MB的文件,在將20臺電腦依次接入神州數碼網易通DCS 2026、H3C S1024R和CICCO3550后,將每臺電腦上的845MB文件拷貝到利用網上鄰居所看到的IBMX3600上的共享文件夾。在服務器上利用EtherPeek抓包軟件對交換機上所有流經與服務器相連端口的數據進行了抓包分析。
(1).對DCS 2026交換機的數據測試
神州數碼網易通DCS 2026在依次將客戶端電腦的文件向服務器上拷貝時,只能支持l2臺電腦同時向服務器拷貝,當第13臺電腦向服務器上拷貝文件時,網絡連接不可見,此時客戶端長Ping服務器正常。同時,服務器上的端口流量也由12臺時的62.284Mbits/s銳減到41.183dbits/s。通過分析交換機網絡故障出現后的捕獲數據包,發現41.183dbits/s的流量數據幾乎全是Ping包一類的小數據包。
該現象說明網易通DCS2026交換機在端口達到63Mbits/s左右的流量時,對大尺寸數據包做了丟棄處理,對于Ping包這類小尺寸數據包進行了正常的轉發,這也就是為何故障出現時各客戶端能Ping通服務器,但無法通過網上鄰居訪問服務器的原因了。為排除單一端口故障,在網易通DCS 2026上換端口測試,結果一樣。
(2).對H3C S1024R交換機的數據測試
在同樣的軟硬件環境下,H3C S1024R交換機在與其相連的第17臺電腦向服務器發送數據時,故障出現。此時的流量由73Mbits/s左右減少到42.23Mbits/s,與神州數碼的現象有所不同。所有電腦長Ping服務器都是正常的,并且先向服務器進行文件傳送的9臺客戶端電腦工作正常.后8臺電腦與服務器的網上鄰居的連接中斷。該測試結果表明H3C S1024R交換機沒有對所有的大尺寸數據包進行丟棄,而是交換機內部對轉發的數據進行了優先級處理。
(3).對cisco3550交換機的數據測試
在對CISCO3550交換機進行測試時,與其相連的2O臺電腦在長Ping服務器正常的情況下,全都能向服務器進行正常的文件發送,其端口流量達到了101.4Mbits/s。上述測試均是在每種型號的交換機連接20臺客戶端電腦時進行的。隨后我們依次在各交換機上只連接服務器和一臺客戶端電腦.由客戶端向服務器傳送前面測試中使用的同一個大小為845MB的文件,CISCO耗時180s,神州數碼網易通DCS 2026耗時179s,H3C S1024R交換機則用了234s。測試結果表明,在交換機負荷較小的情況下,CISC03550和神州數碼網易通DCS 2026端口流量相仿,而而H3C S1024交換機稍弱。
***,對數據存盤操作時的數據流量進行了測試,通過抓包分析,在單臺電腦上做數據的存盤操作時(向服務器上保存文件),在25s時間內我們對打開的工程文件連續點擊保存按鈕,向服務器進行存盤操作,平均流量達到了496kbits/s。機房中共有7臺交換機級連.每臺交換機均有24口,根據測試數據,學生在做試題時,對發向與服務器相連端口的并發操作總流量可進行如下計算:496x7x23=76.57Mbits/s。該流量大于前面測出的神州數碼2026交換機單個端口的***流量62.284Mbits/s。通過上述測試結果,我們可以得出結論:該次交換機故障的產生是由于所使用的神州數碼網易通2026交換機端口流量受限造成。其根本原因在于,當轉發數據量較大時該型號交換機對大尺寸數據包進行了丟棄處理。
5.解決方案
交換機網絡故障解決方案如下:在設備的選擇上,增加一臺cisco3550或類似性能的匯聚交換機.或在現有交換機上添加千兆模塊,并將服務器與其相連,網絡拓撲由級連改為星型架構,接入交換機可繼續采用H3C S1024R或類似性能的交換機。并將各接入交換機全部與匯聚交換機相連。
總結:充分了解網絡的流量模式以及所使用交換機的端口實際***流量,是能否發揮交換機作用的一個非常重要的因素。使用交換機的目地就是盡可能地減少和過濾網絡中的數據流量,所以如果網絡中的某臺交換機由于安裝位置設置不當,而幾乎需要轉發接收到的所有數據包的話,交換機就無法發揮其優化網絡性能的作用,反而降低了數據的傳輸速度,增加了網絡延遲,甚至因為生產廠家出于設計方面的考慮,對特定類型的數據包做丟棄處理,從而引發網絡使用中的各類奇特故障。