交換機性能下降引發蝴蝶效應
本文下面的一則網絡故障,就是由于交換機性能下降,無法抵擋局域網廣播風暴的襲擊,而出現了緩存溢出錯誤,最終導致局域網出現無法上網故障!考慮到該故障發生機率不高,解決起來很容易走彎路,為此筆者就將該故障的詳細排查經過還原出來,與各位朋友共同交流!
部分計算機不能連網
某單位局域網規模不是很大,共有40臺左右的普通計算機分別連接到品牌、型號完全相同的兩個二層交換機上,兩個二層交換機又通過級聯方式與單位的核心交換機相連,同時兩臺文件服務器也直接被連接到核心交換機上,并通過核心交換機與Internet網絡直接保持連接。
平時,局域網中的每一臺普通計算機都能訪問單位的文件服務器,也能通過局域網網絡直接到Internet中上網沖浪,并且連接到兩個不同二層交換機中的計算機相互之間也能進行共享訪問。在相當長的一段時間內,局域網中的所有交換機都能正常工作;可是近日,局域網中有幾位用戶想通過網絡共享交流文件,結果他們無論怎么鼓搗,也不能從網上鄰居窗口中找到對方的共享資源,沒辦法他們只好向筆者求援;起初,筆者還以為這僅僅是一種個別現象,可是沒有多長時間,又有一些朋友來電說網絡不能訪問了,直到此時筆者才意識到局域網網絡中可能真的出現了大問題。
筆者隨機來到一臺不能上網的普通計算機現場,對其各個上網細節進行了全面檢查,結果看到該計算機上網參數設置正確、網絡接口連接牢靠、系統自身也運行正常;之后,筆者又檢查了幾臺計算機,發現有的計算機竟然能夠上網訪問Internet網絡中的內容,并且網絡訪問速度還很快。仔細對比了能上網與不能上網計算機的各個細節因素后,筆者竟然找不出任何可疑的地方,這究竟是什么原因呢?
故障現象初步排查
既然局域網中同時有多臺普通計算機不能上網訪問,那會不會是局域網中的核心網絡設備出現了問題呢?想到這一點,筆者立即來到局域網的主機房,查看了接線柜中的各個交換機設備,偶然發現其中一個二層交換機工作狀態明顯不正常(如圖2所示),因為該交換機控制面板中的所有信號燈全部處于點亮但不閃爍狀態,信號燈一直不閃爍,那就意味著網絡中沒有數據信號在交換傳輸。經過進一步檢查測試,筆者發現凡是連接到故障交換機中的所有計算機都不能上網,而連接到另外一個二層交換機上的所有計算機都能正常上網。
會不會是那臺長亮不閃爍的交換機遇到了硬件故障呢?為了驗證那臺故障交換機是否真的存在硬件損壞,筆者先是拔下連接該交換機的電源線纜,過幾分鐘后又重新插入電源線纜,之后筆者看到故障交換機在重新啟動后,對應控制面板中的信號燈居然全部恢復正常的閃爍狀態了;此時,筆者再從故障計算機中嘗試訪問Internet網絡時,發現網絡連接也已經正常了,并且網絡連接速度也是一氣呵成。筆者做夢都沒想到,簡單地重新啟動了一下故障交換機設備,看上去非常復雜的網絡故障竟然瞬間被解決了;然而好景不長,故障交換機設備重新啟動一個小時之后,其控制面板中的所有信號燈又變成長亮不閃爍狀態了,原先能夠訪問網絡的計算機也不能正常上網訪問了,而這個時候單位的核心交換機以及另外一臺二層交換機工作狀態一切正常,這是什么原因呢?
深入追究故障原因
由于故障交換機在重新啟動后能夠正常工作一段時間,這說明該交換機沒有發生硬件損壞,看來問題還是出在“軟”設置上,會不會是網絡病毒在暗中“作祟”呢?筆者聯想到前一段時間,局域網中曾經出現過由于網絡病毒發作引起的上網速度緩慢現象,后來要求每一位自己動手查殺病毒的,但筆者相信局域網中肯定還有病毒存在,會不會是這些殘余的網絡病毒造成了交換機工作狀態不正常呢?但轉念一想,要是真的是網絡病毒在暗中“作祟”的話,那局域網中的兩臺二層交換機都應該出現故障才對呀,畢竟它們的品牌、型號完全相同,甚至連接方式也是完全相同的,而現在只有其中的一臺二層交換機發生故障,于是筆者認定故障交換機還是存在硬件故障,要想解決部分計算機不能上網的故障現象,唯一的辦法就是更換交換機設備。
但由于單位沒有備用交換機可以使用,筆者只好先關閉那臺二層交換機的電源,準備過一段時間向上反映情況之后購買新交換機回來再說。趁這些普通計算機不能訪問網絡的間隙,筆者決定自己動手對連接到故障交換機中的所有計算機進行全面殺毒,以便將威脅局域網穩定工作的各個因素全面排除。耗費了幾天時間殺毒之后,筆者看到局域網中果然隱藏了不少流行病毒,到網上隨意搜索一個病毒的詳細資料時,發現這種類型的網絡病毒容易引發廣播風暴現象;有沒有可能是網絡病毒引發的廣播風暴現象,造成了那臺二層交換機不能正常工作呢?由于目前局域網中的所有病毒都被清除干凈了,按理來說這個時候局域網中就不應該繼續存在廣播風暴現象了,那么那臺二層交換機的工作狀態會不會也能跟著恢復正常呢?為了檢驗自己的猜測是否正確,筆者將那臺二層交換機的電源重新接通,起初的一段時間那臺交換機的工作狀態很正常,不過筆者仍然擔心過一個小時后該交換機又會出現相同的故障;不過事實證明自己的擔心是多余的,連續過了幾個小時,那臺二層交換機控制面板中的所有指示燈狀態依然處于閃爍狀態,直到此時筆者才隱約感覺到該交換機不會出現問題了。果然,經過連續幾天的運行,先前不能上網的部分計算機再也沒有掉過線,這說明上述網絡故障已經被成功解決。
揭開交換機癱瘓之謎
盡管部分計算機不能上網的故障已經被解決了,不過其中的一臺二層交換機為什么會癱瘓,還是讓筆者一直疑惑不解,因為局域網中既然存在廣播風暴現象,那么品牌、型號、連接方式完全相同的另外一臺二層交換機為什么沒有受到任何影響呢?帶著這樣的疑問,筆者到網上求教了一些網絡高手,經過與網絡高手們進行反復交流分析,終于找到了交換機癱瘓的真正原因:網絡病毒是部分計算機不能上網的表面原因,因為網絡病毒造成了局域網發生了廣播風暴現象,這種現象致使其中的一臺二層交換機工作狀態不正常,所以連接到該故障交換機中的所有計算機都不能上網訪問了;事實上,那臺癱瘓的二層交換機自身性能下降才是網絡不通的真正原因,雖然局域網中的兩臺二層交換機型號、品牌、連接方式都相同,但它們持續工作的時間可能不相同,那么交換機內部的性能元件老化程度也不相同,其中性能老化嚴重的那臺二層交換機無法抵擋廣播風暴現象的襲擊,最終引發了緩存溢出錯誤;當筆者將局域網中的所有病毒全部清除干凈后,那么廣播風暴現象也就不會襲擊故障交換機了,這也是在重新啟動一下故障交換機系統后,對應系統的工作狀態能夠恢復正常的原因。
最后的故障總結
從上面的故障排除過程來看,我們認為交換機性能的好壞對局域網整體性能的穩定有多么重要!為了讓局域網網絡能夠更加穩定地運行,我們在組建局域網的時候,不能一味看中產品價格,去選用一些質量不好、內存容量不大的低價交換機,而應該去選用那些質量可靠、品牌過硬、內存容量較大的交換機設備,畢竟這樣的高檔設備自身有較強的抗干擾能力。
為了防止局域網中頻繁出現廣播風暴現象,我們應該在局域網中安裝配置專業防火墻程序,并且在每一臺計算機中安裝殺毒軟件,同時及時在線更新病毒庫程序進行病毒清除操作。當然,除了網絡病毒會造成廣播風暴現象外,由網絡連接出錯而引起的連接環路以及網絡設備的硬件損壞因素,也會引起廣播風暴現象,因此在查殺完網絡病毒后,局域網中要是仍然存在廣播風暴現象時,我們就應該仔細檢查局域網中是否存在網絡環路現象,或者檢查網絡設備是否存在硬件損壞現象。
【編輯推薦】