實(shí)戰(zhàn)應(yīng)對(duì)三種因素引起的交換故障
一般來說,新投入使用的交換機(jī)設(shè)備工作性能往往比較穩(wěn)定,很少會(huì)發(fā)生交換故障;可是,隨著工作時(shí)間的延長,以及網(wǎng)絡(luò)應(yīng)用的不斷變化,交換機(jī)出現(xiàn)故障的機(jī)率也在逐漸增大。
為了提高交換故障的解決效率,保證局域網(wǎng)網(wǎng)絡(luò)能夠始終高效運(yùn)行,本文現(xiàn)在就從實(shí)戰(zhàn)角度出發(fā),來對(duì)常見的三種交換故障進(jìn)行還原解讀,希望大家能夠從中得到一些啟發(fā)!
1.應(yīng)對(duì)緩存溢出故障
某單位局域網(wǎng)共有兩臺(tái)普通交換機(jī),每臺(tái)交換機(jī)都通過百兆雙絞線連接到單位的CISCO路由器 target=_blank>路由器設(shè)備上,并通過該設(shè)備訪問Internet網(wǎng)絡(luò)。平時(shí)每臺(tái)交換機(jī)都連接有大約10臺(tái)計(jì)算機(jī),每臺(tái)計(jì)算機(jī)都能通過交換機(jī)順利地上網(wǎng)訪問;最近不知道怎么回事,單位局域網(wǎng)中有的計(jì)算機(jī)可以正常上網(wǎng),有的計(jì)算機(jī)卻不能上網(wǎng)。
起初的時(shí)候,網(wǎng)絡(luò)管理員還以為是計(jì)算機(jī)自身的因素,可是,在對(duì)計(jì)算機(jī)系統(tǒng)的上網(wǎng)設(shè)置以及網(wǎng)絡(luò)病毒進(jìn)行檢查后,發(fā)現(xiàn)都沒有問題,使用ping命令測(cè)試本地IP地址也是正常的,但是在ping局域網(wǎng)的網(wǎng)關(guān)地址時(shí),發(fā)現(xiàn)不正常,看來故障計(jì)算機(jī)到交換機(jī)之間的這段線路存在問題。
會(huì)不會(huì)是物理線路的連通性存在問題呢?
想到這一點(diǎn),網(wǎng)絡(luò)管理員立即使用網(wǎng)絡(luò)測(cè)試儀 target=_blank>測(cè)試儀,對(duì)連接計(jì)算機(jī)與交換機(jī)的雙絞線連通性進(jìn)行測(cè)試,結(jié)果發(fā)現(xiàn)它們的連通狀態(tài)很正常。
在排除了網(wǎng)絡(luò)線路以及計(jì)算機(jī)自身因素后,網(wǎng)絡(luò)管理員準(zhǔn)備檢查一下交換機(jī)的工作狀態(tài)是否正常;當(dāng)他來到交換機(jī)設(shè)備現(xiàn)場(chǎng)時(shí),他發(fā)現(xiàn)其中一臺(tái)交換機(jī)的所有端口信號(hào)燈狀態(tài)都處于點(diǎn)亮但不閃爍狀態(tài);按理來說,交換機(jī)如果能夠正常處理數(shù)據(jù)信息的話,那么對(duì)應(yīng)交換端口的數(shù)據(jù)信號(hào)燈也應(yīng)該處于閃爍狀態(tài),很明顯現(xiàn)在交換端口點(diǎn)亮但不閃爍,這說明了該交換機(jī)的工作狀態(tài)不正常。而反觀另外一臺(tái)交換機(jī)設(shè)備,網(wǎng)絡(luò)管理員發(fā)現(xiàn)它們的交換端口只要被點(diǎn)亮,基本上都能處于閃爍狀態(tài),這說明這臺(tái)交換機(jī)能夠正常交換數(shù)據(jù)。經(jīng)過進(jìn)一步檢查,網(wǎng)絡(luò)管理員看到那些不能上網(wǎng)的計(jì)算機(jī),基本上都是連接到那臺(tái)工作狀態(tài)不正常的交換機(jī)上的,看來局域網(wǎng)中部分計(jì)算機(jī)不能上網(wǎng)的故障現(xiàn)象是由交換機(jī)引起的。
那么究竟是什么因素造成故障交換機(jī)的端口信號(hào)燈顯示不正常呢?
一般來說,造成這種端口信號(hào)燈狀態(tài)顯示不正常現(xiàn)象的原因主要有兩方面,一方面就是交換機(jī)系統(tǒng)存在問題,例如受到網(wǎng)絡(luò)病毒的攻擊,或者工作時(shí)間長了之后出現(xiàn)了系統(tǒng)緩存溢出錯(cuò)誤等,另外一方面就是交換機(jī)設(shè)備存在硬件問題,例如交換機(jī)服役時(shí)間比較長之后,它內(nèi)部的性能元件容易發(fā)生老化現(xiàn)象,這些老化的元件也容易造成交換機(jī)工作狀態(tài)不正常。
通常,交換機(jī)的設(shè)置不發(fā)生變化,出現(xiàn)的一些“軟”故障往往都能通過重新啟動(dòng)的方法來解決,依照這樣的思路,網(wǎng)絡(luò)管理員立即重新啟動(dòng)了一下故障交換機(jī)系統(tǒng),沒有多長時(shí)間,網(wǎng)絡(luò)管理員觀察到該故障的交換機(jī)端口工作狀態(tài)已經(jīng)恢復(fù)了正常;再次從故障計(jì)算機(jī)系統(tǒng)中嘗試進(jìn)行上網(wǎng)訪問時(shí),以前不能上網(wǎng)的故障現(xiàn)象立即消失了,這說明故障交換機(jī)的確存在類似緩存溢出這樣的“軟”故障,這樣的故障造成了交換機(jī)的工作狀態(tài)無法正常。
如果每重新啟動(dòng)一段時(shí)間后,交換機(jī)又出現(xiàn)相同的故障現(xiàn)象時(shí),那問題很可能是由局域網(wǎng)中的網(wǎng)絡(luò)病毒引起的,因?yàn)橛械木W(wǎng)絡(luò)病毒可能在一定時(shí)間內(nèi),會(huì)對(duì)交換機(jī)系統(tǒng)的內(nèi)存或其他系統(tǒng)資源進(jìn)行不停占用,最終導(dǎo)致交換機(jī)系統(tǒng)的資源全部被消耗殆盡,從而會(huì)引發(fā)局域網(wǎng)中的計(jì)算機(jī)不能上網(wǎng)的故障現(xiàn)象;為了避免網(wǎng)絡(luò)病毒對(duì)交換機(jī)系統(tǒng)的沖擊,我們應(yīng)該在組建網(wǎng)絡(luò)之前,認(rèn)真選用質(zhì)量可靠、性能穩(wěn)定、緩存較大的設(shè)備,同時(shí)注意對(duì)局域網(wǎng)網(wǎng)絡(luò)定期執(zhí)行病毒清除操作。 #p#
2.應(yīng)對(duì)ARP病毒故障
某一天,筆者接到一個(gè)故障申請(qǐng)電話,說618房間的計(jì)算機(jī)突然不能上網(wǎng),并且系統(tǒng)托盤區(qū)域處的網(wǎng)絡(luò)連接圖標(biāo)上有紅色叉號(hào)標(biāo)記出現(xiàn);起初筆者以為肯定是網(wǎng)絡(luò)線纜出現(xiàn)了松動(dòng),要求該用戶自行將網(wǎng)線拔下來重新插一下,確保網(wǎng)絡(luò)線纜與墻上的上網(wǎng)插口以及網(wǎng)卡接口之間連接牢靠,可是該用戶按照筆者要求重新插拔了網(wǎng)絡(luò)線纜后,還是出現(xiàn)相同的故障現(xiàn)象。
筆者不放心,立即登錄到618房間所使用的交換機(jī)系統(tǒng)上,查看了對(duì)應(yīng)交換端口的工作狀態(tài),發(fā)現(xiàn)目標(biāo)端口處于“up”狀態(tài),這說明交換端口的工作狀態(tài)也是正常的。后來,筆者懷疑618房間的計(jì)算機(jī)使用的IP地址可能與其他計(jì)算機(jī)的IP地址發(fā)生了沖突,于是建議那位上網(wǎng)用戶換一個(gè)IP地址試試,果然在重新更換IP地址后,618房間的計(jì)算機(jī)又能正常上網(wǎng)了。
然后,沒有多長時(shí)間,618隔壁房間的計(jì)算機(jī)又打來電話向筆者求援說,他們的計(jì)算機(jī)也不能正常上網(wǎng)了;筆者經(jīng)過查閱檔案資料,發(fā)現(xiàn)出現(xiàn)故障的計(jì)算機(jī)基本都處于相同的虛擬工作子網(wǎng)中,看來這種故障現(xiàn)象并不簡單是由人工修改IP地址造成沖突引起的,很可能是對(duì)應(yīng)虛擬工作子網(wǎng)中出現(xiàn)了ARP病毒。
我們知道,現(xiàn)在ARP病毒非常瘋狂,局域網(wǎng)中的計(jì)算機(jī)很容易感染該病毒,而該病毒往往會(huì)欺騙局域網(wǎng)中所有計(jì)算機(jī)以及網(wǎng)絡(luò)設(shè)備,并強(qiáng)制目標(biāo)計(jì)算機(jī)通過特定的病毒主機(jī)進(jìn)行上網(wǎng)訪問。很多計(jì)算機(jī)被感染了ARP病毒后,之所以不能上網(wǎng)或者訪問網(wǎng)絡(luò)的速度會(huì)下降,主要是由于在正常狀態(tài)下目標(biāo)計(jì)算機(jī)的網(wǎng)卡IP地址與物理地址是一一對(duì)應(yīng)的,當(dāng)目標(biāo)計(jì)算機(jī)的網(wǎng)卡設(shè)備從DHCP服務(wù)器 target=_blank>服務(wù)器那里申請(qǐng)得到IP地址后,該地址就會(huì)被臨時(shí)與網(wǎng)卡設(shè)備的物理地址“捆綁”在一起,并且還會(huì)被自動(dòng)記憶存儲(chǔ) target=_blank>存儲(chǔ)到本地系統(tǒng)的ARP映射表中;當(dāng)局域網(wǎng)中有計(jì)算機(jī)被意外感染了ARP病毒后,ARP病毒就會(huì)強(qiáng)行把病毒計(jì)算機(jī)的網(wǎng)卡物理地址映射到局域網(wǎng)的交換機(jī)或路由器設(shè)備上,并且還會(huì)自動(dòng)向網(wǎng)絡(luò)中發(fā)送大量的ARP廣播信息,局域網(wǎng)中的其他計(jì)算機(jī)收到廣播信息后,往往會(huì)錯(cuò)誤地認(rèn)為病毒計(jì)算機(jī)就是局域網(wǎng)的網(wǎng)關(guān)地址,這樣一來其他計(jì)算機(jī)就會(huì)自動(dòng)把上網(wǎng)請(qǐng)求轉(zhuǎn)發(fā)到病毒計(jì)算機(jī)上,而病毒計(jì)算機(jī)實(shí)際上并不是真正的網(wǎng)關(guān)地址,所以其他計(jì)算機(jī)自然也就不能正常上網(wǎng),即使能夠上網(wǎng)速度也不會(huì)很快了。
為了查清楚究竟是哪臺(tái)計(jì)算機(jī)感染了ARP病毒,筆者立即以系統(tǒng)管理員身份登錄進(jìn)入到目標(biāo)交換機(jī)系統(tǒng),進(jìn)入該系統(tǒng)的全局配置狀態(tài),利用“display dia”命令,查看目標(biāo)交換機(jī)各個(gè)交換端口的工作狀態(tài),結(jié)果發(fā)現(xiàn)網(wǎng)卡物理地址為0016-173d-43eb的計(jì)算機(jī)與對(duì)應(yīng)虛擬工作子網(wǎng)的網(wǎng)關(guān)地址存在沖突現(xiàn)象;為了追查出網(wǎng)卡物理地址為0016-173d-43eb的計(jì)算機(jī)究竟位于哪個(gè)房間,筆者立即在交換機(jī)的全局配置命令行狀態(tài)下,執(zhí)行字符串命令“display mac”,從其后出現(xiàn)的結(jié)果界面中,筆者看到網(wǎng)卡物理地址為0016-173d-43eb的計(jì)算機(jī)使用了43交換端口。
為了防止ARP病毒繼續(xù)影響局域網(wǎng)的工作狀態(tài),筆者在交換機(jī)的后臺(tái)管理界面中,執(zhí)行字符串命令“interface e0/43”,進(jìn)入43交換端口的視圖配置狀態(tài),并且在該狀態(tài)下繼續(xù)執(zhí)行字符串命令“shutdown”,將43交換端口暫時(shí)關(guān)閉掉,這樣一來病毒計(jì)算機(jī)就不能通過該交換端口向局域網(wǎng)網(wǎng)絡(luò)發(fā)送ARP病毒信息了,此時(shí)與病毒計(jì)算機(jī)同處一個(gè)虛擬工作子網(wǎng)的其他計(jì)算機(jī)立即都能正常上網(wǎng)了。
臨時(shí)關(guān)閉43交換端口的工作狀態(tài)后,筆者立即又查看了組網(wǎng)時(shí)完善起來的檔案記錄,發(fā)現(xiàn)43交換端口被分配給了563房間使用上網(wǎng)了;于是,筆者立即電話聯(lián)系563房間的上網(wǎng)用戶,告訴他的計(jì)算機(jī)已經(jīng)感染了ARP病毒,目前已經(jīng)被強(qiáng)行從網(wǎng)絡(luò)中斷開,并且要求該用戶必須使用最新版本的殺毒軟件對(duì)其使用的計(jì)算機(jī)進(jìn)行病毒查殺操作;在查殺完病毒之后,筆者在對(duì)應(yīng)交換端口的視圖配置狀態(tài)下,又執(zhí)行了“undo shutdown”字符串命令,重新將43交換端口的工作狀態(tài)激活,之后再次執(zhí)行“display dia”命令,發(fā)現(xiàn)局域網(wǎng)中已經(jīng)不存在地址沖突現(xiàn)象了,這說明局域網(wǎng)中的ARP病毒故障已經(jīng)被成功解決了。 #p#
3.應(yīng)對(duì)網(wǎng)絡(luò)環(huán)路故障
某大樓網(wǎng)絡(luò)共包含12個(gè)虛擬工作子網(wǎng),每一樓層的所有計(jì)算機(jī)都通過1000M六類雙絞線連接到華為系列的可管理交換機(jī)設(shè)備上,各個(gè)樓層中的二層交換機(jī)全部通過1000M級(jí)別的光纖線路連接到大樓網(wǎng)絡(luò)的華為S8500核心路由交換機(jī)上,核心路由交換機(jī)再使用千兆光纖線路連接到單位的天融信硬件防火墻上,最后通過本地的電信線路訪問Internet網(wǎng)絡(luò),平時(shí)大樓內(nèi)各個(gè)樓層的計(jì)算機(jī)都能正常上網(wǎng),遇到一些極個(gè)不能上網(wǎng)的現(xiàn)象時(shí),網(wǎng)絡(luò)管理員經(jīng)過控制交換機(jī)系統(tǒng),都能快速找到故障原因,并能快速恢復(fù)網(wǎng)絡(luò)故障。
然而好景不長,某天上午,網(wǎng)絡(luò)管理員先是接到來自10樓上網(wǎng)用戶的故障保修電話,說是該樓層中的所有計(jì)算機(jī)瞬間都不能上網(wǎng)了;剛開始的時(shí)候,網(wǎng)絡(luò)管理員估計(jì)夏天到了,肯定是樓層交換機(jī)工作時(shí)間長了,內(nèi)部無法及時(shí)散發(fā)出來的熱量造成了交換機(jī)的工作狀態(tài)不正常了,對(duì)于這樣的現(xiàn)象,往往只要讓交換機(jī)稍微休息一會(huì),再重新啟動(dòng)一下就能解決問題了。剛準(zhǔn)備按照這樣的思路進(jìn)行操作,誰曾想到,在短短的幾分鐘了,其他樓層的上網(wǎng)用戶也不停向網(wǎng)絡(luò)管理員進(jìn)行電話“求援”,并且申請(qǐng)解決的故障現(xiàn)象幾乎都是相同的,顯然這樣的現(xiàn)象肯定不是由于交換機(jī)自身散熱不良引起的,畢竟在相同的時(shí)間段內(nèi)不可能有這么多樓層交換機(jī)同時(shí)出現(xiàn)散熱不好的現(xiàn)象,看來問題很可能是大樓網(wǎng)絡(luò)的核心交換機(jī)或硬件防火墻遇到了意外。
網(wǎng)絡(luò)管理員立即以特權(quán)賬號(hào)登錄進(jìn)入核心交換機(jī)后臺(tái)管理系統(tǒng),在該系統(tǒng)的命令行狀態(tài),使用ping命令測(cè)試了硬件防火墻的IP地址,測(cè)試結(jié)果發(fā)現(xiàn)ping命令可以測(cè)試成功,不過響應(yīng)時(shí)間明顯有點(diǎn)偏長;既然硬件防火墻能夠被正常ping通,那就意味著該設(shè)備的工作狀態(tài)是正常的,于是筆者決定還是先來查看一下核心交換機(jī)的工作狀態(tài)是否正常。想到做到,網(wǎng)絡(luò)管理員在核心交換機(jī)的后臺(tái)管理界面,執(zhí)行“system”字符串命令,將交換機(jī)系統(tǒng)切換到系統(tǒng)全局配置狀態(tài),在該狀態(tài)下輸入字符串命令“display cpu”,單擊回車鍵后,筆者發(fā)現(xiàn)核心交換機(jī)每一塊插卡上的CPU消耗率都達(dá)到了50%以上,而在正常工作狀態(tài)下,每塊交換插卡的CPU消耗率都應(yīng)該在20%左右,顯然大樓網(wǎng)絡(luò)內(nèi)的上網(wǎng)流量出現(xiàn)了異常,正是這些大容量的數(shù)據(jù)交換信息在不停沖擊核心交換機(jī)的插卡,才導(dǎo)致了核心交換機(jī)的系統(tǒng)CPU資源被大量消耗,最終造成了核心交換機(jī)工作狀態(tài)不正常。
那么究竟是什么因素造成了大樓網(wǎng)絡(luò)內(nèi)的上網(wǎng)流量出現(xiàn)了明顯異常呢?是惡意使用BT下載?是網(wǎng)絡(luò)病毒?還是網(wǎng)絡(luò)環(huán)路呢?
筆者立即在核心交換機(jī)的后臺(tái)系統(tǒng)使用“display dia”命令,對(duì)核心交換機(jī)的各個(gè)光纖端口狀態(tài)進(jìn)行了掃描診斷,結(jié)果發(fā)現(xiàn)與硬件防火墻保持連接的那個(gè)光纖端口數(shù)據(jù)流量竟然達(dá)到了19000M/s左右,而這樣大的數(shù)據(jù)流量BT下載應(yīng)用是不可能達(dá)到的,而網(wǎng)絡(luò)病毒也沒有這樣的能力,很顯然這么大的數(shù)據(jù)流量只有網(wǎng)絡(luò)環(huán)路才能做得到。為了驗(yàn)證自己的猜測(cè),網(wǎng)絡(luò)管理員立即使用“display interface”字符串命令,來查看核心交換機(jī)每一個(gè)光纖端口的輸入、輸出流量,對(duì)于那些輸入、輸出流量同時(shí)達(dá)到1000M/s以上級(jí)別時(shí),繼續(xù)不停執(zhí)行“display interface”字符串命令,看看輸出廣播包數(shù)量每秒鐘增加的幅度有沒有超過500M/s左右大小,如果超過這個(gè)大小,那就說明對(duì)應(yīng)交換端口下的虛擬工作子網(wǎng)中存在網(wǎng)絡(luò)風(fēng)暴現(xiàn)象。經(jīng)過對(duì)每一個(gè)交換端口的輸入、輸出流量進(jìn)行詳細(xì)檢查,網(wǎng)絡(luò)管理員終于找到“g0/1/6”這個(gè)光纖端口數(shù)據(jù)流量不正常,輸入流量竟然也達(dá)到了5000M/s左右,經(jīng)過反復(fù)執(zhí)行“display interface g0/1/6”字符串命令,網(wǎng)絡(luò)管理員最終確認(rèn)連接到“g0/1/6”這個(gè)光纖端口下的虛擬工作子網(wǎng)中存在網(wǎng)絡(luò)風(fēng)暴現(xiàn)象。
為了弄清楚究竟是硬件設(shè)備損壞還是網(wǎng)絡(luò)環(huán)路引起了網(wǎng)絡(luò)風(fēng)暴現(xiàn)象,網(wǎng)絡(luò)管理員立即來到與“g0/1/6”這個(gè)光纖端口保持連接的樓層交換,以系統(tǒng)管理員權(quán)限登錄進(jìn)入該樓層交換機(jī)的后臺(tái)管理系統(tǒng),并使用ping命令測(cè)試核心交換機(jī)的IP地址時(shí),發(fā)現(xiàn)ping命令根本無法測(cè)試成功,很顯然該樓層交換機(jī)工作狀態(tài)不正常。不得已,網(wǎng)絡(luò)管理員只好使用“display interface”字符串命令,對(duì)該交換機(jī)的每一個(gè)以太交換端口進(jìn)行檢查,結(jié)果看到“e0/35”這個(gè)交換端口的輸入、輸出流量竟然達(dá)到了10000M/s級(jí)別,立即進(jìn)入“e0/35”這個(gè)交換端口的視圖配置狀態(tài),執(zhí)行字符串命令“shutdown”,將“e0/35”交換端口的工作狀態(tài)臨時(shí)關(guān)閉;之后,網(wǎng)絡(luò)管理員重新ping了一下核心交換機(jī)的IP地址,這一次測(cè)試竟然成功了,這說明該樓層交換機(jī)的工作狀態(tài)已經(jīng)恢復(fù)正常。
完成上面的檢查工作后,網(wǎng)絡(luò)管理員隨即又聯(lián)系了剛才報(bào)修故障的幾位上網(wǎng)用戶,請(qǐng)他們配合進(jìn)行一下上網(wǎng)測(cè)試,沒有多長時(shí)間,所有上網(wǎng)用戶的回復(fù)都說網(wǎng)絡(luò)訪問已經(jīng)正常,這說明大樓各個(gè)樓層不能上網(wǎng)的故障已經(jīng)被成功解決了。
后來,網(wǎng)絡(luò)管理員又查閱了相關(guān)的檔案資料,發(fā)現(xiàn)使用“e0/35”交換端口的上網(wǎng)用戶是1613房間,網(wǎng)絡(luò)管理員立即火速趕到該房間現(xiàn)場(chǎng),對(duì)他們的上網(wǎng)線路進(jìn)行了檢查,結(jié)果發(fā)現(xiàn)該房間下掛了一臺(tái)普通的集線器,而恰好該房間當(dāng)天有人在維修窗戶,在維修期間工作人員將所有網(wǎng)絡(luò)線纜全部拔了下來,在窗戶修好之后,工作人員由于不熟悉網(wǎng)絡(luò)連接操作,就隨意地進(jìn)行了網(wǎng)絡(luò)連接操作,最終引起了網(wǎng)絡(luò)環(huán)路現(xiàn)象,從而造成了整個(gè)大樓網(wǎng)絡(luò)上網(wǎng)出現(xiàn)了故障。
【編輯推薦】