路由器頻繁啟動(dòng)故障解決
路由器是怎么壞的,可能灰塵是非常重要的一個(gè)原因了。本篇是一位系統(tǒng)管理員發(fā)現(xiàn)的因?yàn)榛覊m“惹禍”,導(dǎo)致路由器頻繁啟動(dòng)的故障案例,值得大家參考。
案例回放:路由器頻繁啟動(dòng)
筆者所處的市局科技網(wǎng)絡(luò)與各個(gè)縣市、區(qū)的科技網(wǎng)絡(luò),通過(guò)本地電信部門的2Mb光纖信道連接在一起架設(shè)成了全市科技系統(tǒng)的廣域網(wǎng),最近一段時(shí)間廣域網(wǎng)遭遇了一則離奇的網(wǎng)絡(luò)故障,所有各個(gè)縣市、區(qū)的科技網(wǎng)絡(luò)都無(wú)法訪問(wèn)市局的科技網(wǎng)絡(luò),當(dāng)時(shí)正趕上在線申報(bào)市級(jí)星火項(xiàng)目計(jì)劃,不少基層單位都在各個(gè)縣市、區(qū)的科技網(wǎng)絡(luò)中心等著在線申報(bào)市級(jí)星火項(xiàng)目計(jì)劃,由于廣域網(wǎng)出現(xiàn)意外,全市的在線申報(bào)業(yè)務(wù)不得不暫時(shí)停止下來(lái),這在當(dāng)時(shí)造成了不小的影響,局長(zhǎng)立即批示要求網(wǎng)絡(luò)中心必須全力以赴、迅速解決這起離奇的網(wǎng)絡(luò)故障;故障就是命令,我們網(wǎng)絡(luò)中心的幾名同志一接到這樣的命令后,就開始了對(duì)故障現(xiàn)象的排查與分析。
考慮到各個(gè)縣市、區(qū)的科技網(wǎng)絡(luò)都無(wú)法訪問(wèn)市局的科技網(wǎng)絡(luò),我們估計(jì)這則故障肯定與各個(gè)縣市、區(qū)的科技網(wǎng)絡(luò)無(wú)關(guān),多半是市局的相關(guān)連接線路或網(wǎng)絡(luò)設(shè)備發(fā)生了故障;順著這一思路,我們?cè)谑芯志W(wǎng)絡(luò)中心找了一臺(tái)能夠正常上網(wǎng)的工作站,在該工作站系統(tǒng)環(huán)境下我們打開了系統(tǒng)運(yùn)行對(duì)話框,并在其中執(zhí)行了Ping命令,來(lái)測(cè)試一下廣域網(wǎng)的核心路由器IP地址是否能夠Ping通,結(jié)果發(fā)現(xiàn)的確無(wú)法Ping通核心路由器的IP地址,接下來(lái)我們又Ping了一下局域網(wǎng)中的其他普通工作站的IP地址,結(jié)果發(fā)現(xiàn)到局域網(wǎng)其他工作站的網(wǎng)絡(luò)連接很正常,從上面的測(cè)試操作來(lái)看我們幾乎就斷定廣域網(wǎng)故障是擔(dān)負(fù)信息中轉(zhuǎn)“角色”的核心路由器引起的。
市局的科技網(wǎng)絡(luò)使用了Cisco 7507型號(hào)的路由器設(shè)備作為整個(gè)廣域網(wǎng)系統(tǒng)的核心路由器,檢查該路由器的信號(hào)燈工作狀態(tài)時(shí),我們發(fā)現(xiàn)該設(shè)備控制面板中的system信號(hào)燈總處于不停地閃爍狀態(tài),很明顯該設(shè)備工作狀態(tài)不正常,同時(shí)發(fā)現(xiàn)核心路由器過(guò)一段時(shí)間就會(huì)進(jìn)行重新啟動(dòng)。
案例解析:灰塵惹禍
為了檢查核心路由器究竟發(fā)生了什么故障,我們使用Console控制線將核心路由器直接和本地局域網(wǎng)中的一臺(tái)工作站相連,并依次執(zhí)行該工作站系統(tǒng)中的“開始”/“程序”/“附件”/“通訊”/“超級(jí)終端”命令,打開了如圖1所示的窗口,在該窗口中創(chuàng)建了一條與核心路由器直接連接的超級(jí)終端連接,進(jìn)入超級(jí)終端控制窗口后我們發(fā)現(xiàn)核心路由器遇到了啟動(dòng)故障,同時(shí)系統(tǒng)還出現(xiàn)了“system received a Bus Error exception”這樣的錯(cuò)誤提示,通過(guò)這個(gè)提示我們確認(rèn)核心路由器在啟動(dòng)過(guò)程中發(fā)生了一個(gè)總線故障,該故障引起了核心路由器不斷重復(fù)啟動(dòng)。
考慮到總線常常位于設(shè)備的主板中,因此我們推測(cè)核心路由器的故障發(fā)生在主板中。于是一不做、二不休,我們迅速找來(lái)了“十”字形螺絲刀,將核心路由器背面的螺絲釘全部擰開,然后抽出其中的業(yè)務(wù)板卡,發(fā)現(xiàn)該板卡表面覆蓋了一層厚厚的灰塵,再看看核心路由器內(nèi)置的主板時(shí),我們頓時(shí)驚呆了,該主板表面竟然也覆蓋了一層灰塵,難道是灰塵的覆蓋引起了路由器發(fā)生了總線故障?想起以前從網(wǎng)上看到的許多故障解決案例,都提醒我們?cè)诮鉀Q網(wǎng)絡(luò)故障的過(guò)程中不要忽視一些細(xì)小的環(huán)節(jié),特別是灰塵能導(dǎo)致網(wǎng)絡(luò)設(shè)備發(fā)生各種莫名其妙的故障,于是我們也對(duì)灰塵進(jìn)行了懷疑。
為了檢驗(yàn)灰塵是否是引起核心路由器發(fā)生故障的“罪槐禍?zhǔn)住保覀兞⒓撮_始了灰塵清潔干凈。網(wǎng)絡(luò)中心的幾位同事分頭行動(dòng),找來(lái)了柔軟的小毛刷,專門用于電子設(shè)備的吸塵器,然后使用工具將核心路由器中的所有板卡全部抽取了出來(lái),并通過(guò)小毛刷和吸塵器將核心路由器的主板和所有板卡表面的灰塵全部清潔干凈了。清潔掉灰塵之后,我們又對(duì)主板中的各個(gè)芯片和電子元件進(jìn)行了認(rèn)真而詳細(xì)的檢查,以便看看主板中的電子部件是否存在燒毀現(xiàn)象,經(jīng)過(guò)一番仔細(xì)檢查后,我們并沒(méi)有發(fā)現(xiàn)電子元件被燒壞的任何跡象。
于是抱著試一試的心態(tài),我們將各塊板卡恢復(fù)到原位,然后重新將核心路由器接入到網(wǎng)絡(luò)中,并接通電源、按下開關(guān)進(jìn)行重新啟動(dòng),待路由器系統(tǒng)啟動(dòng)穩(wěn)定后,我們重新Ping了一下核心路由器的IP地址,結(jié)果這一次發(fā)現(xiàn)Ping命令測(cè)試成功,再嘗試進(jìn)行在線申報(bào)項(xiàng)目時(shí),發(fā)現(xiàn)操作也正常了。至此,廣域網(wǎng)無(wú)法訪問(wèn)的故障就被徹底排查了,而引起該故障的“罪槐禍?zhǔn)住币脖淮_認(rèn)是讓人容易忽視的灰塵。
總結(jié)
總結(jié)上面的故障發(fā)生原因,我們認(rèn)為灰塵覆蓋在核心路由器主板以及電子元件表面后,不但會(huì)導(dǎo)致核心路由器在長(zhǎng)時(shí)間工作后散熱不良,引發(fā)路由器工作不穩(wěn)定現(xiàn)象的發(fā)生,而且在雨水多發(fā)的季節(jié)里,太多的灰塵特別容易吸收空氣中的水分,這樣一來(lái)潮濕的灰塵覆蓋在電子元件表面時(shí)很容易導(dǎo)致核心路由器發(fā)生莫名其妙的故障。
所以,從上面的故障現(xiàn)象中,我們不難看出灰塵對(duì)網(wǎng)絡(luò)設(shè)備的工作影響是多么巨大;為了確保網(wǎng)絡(luò)始終處于穩(wěn)定、高效運(yùn)行狀態(tài),我們建議網(wǎng)絡(luò)管理人員平時(shí)一定要做好網(wǎng)絡(luò)設(shè)備的清潔維護(hù)工作,同時(shí)確保為網(wǎng)絡(luò)設(shè)備提供一個(gè)干凈、整潔的工作環(huán)境,只有這樣才能提高廣域網(wǎng)或局域網(wǎng)的網(wǎng)絡(luò)運(yùn)行效率。
【編輯推薦】