撥開迷霧 解惑間歇性斷網故障
無論多么大規模的局域網網絡,遇到這種或那種稀奇古怪的網絡故障是不可避免的事情,其中最讓單位網管員感覺麻煩的就是Internet網絡訪問的間歇性中斷了,畢竟隨著網絡技術的不斷發展以及逐步成熟,很多單位的員工特別是從事網絡服務單位的員工幾乎已經到了一時一刻也無法離開網絡的地步了。要是單位局域網與Internet網絡的連接頻繁發生中斷的話,那么許多單位的員工基本上就將無法正常開展工作了。最近筆者所在單位的局域網曾經遭受過這樣一則離奇的歇性斷網故障,現在筆者就將處理該網絡故障的詳細過程貢獻出來和大家分享,希望大家能夠從中受到一點啟發!
故障回放
筆者單位所在的局域網網絡規模不是很大,所有工作站數量加起來總共不超過30臺,這些工作站全部連接到二層交換機上,寬帶路由器通過雙絞線與二層交換機的Uplink端口直接相連,而ADSL撥號上網線路與寬帶路由器的外部WAN端口直接相連,局域網中的所有工作站通過這條ADSL線路來訪問Internet網絡。
最近筆者單位負責局域網維護與管理的同事突然離開了工作崗位,剛接手這方面工作的新同事或許由于不熟悉環境或者其他方面的原因,一進入工作崗位就在很短的時間內碰到了不少網絡故障,特別是其中一則網絡故障讓他頭疼不已。該網絡故障的具體現象表現為單位局域網上網時差不多每隔三個小時就會發生一次掉線現象,之后過幾分鐘,局域網又能自動重新訪問Internet網絡了;盡管中途掉線的時間只有幾分鐘,不過考慮到單位很多處室的工作都是在線完成的,與市政府直接相連的電子政務系統也對網絡連接的通暢性要求很高,即使網絡連接發生偶爾斷開現象,也會明顯影響電子政務等工作的正常開展。筆者的這位新同事對局域網中的所有工作站系統進行了詳細檢查,發現所有工作站系統運行狀態一切正常,而且都沒有任何網絡病毒的襲擊,并且局域網中的所有工作站系統都成功啟用了Windows Update服務,這樣保證了所有系統安全補丁程序都能得到及時的安裝;再仔細對所有網絡連接線纜的端口以及連通性進行測試時,新同事也沒有找到任何物理性的故障。
故障排查
在萬般無奈之下,這位新同事及時向筆者發出了“求援”,聽了新同事對網絡故障的詳細敘述后,筆者立即根據他的描述進行了詳細分析,并及時得出了三點結論:***點就是局域網網絡發生了掉線現象,第二點就是該網絡掉線現象屬于間歇性行為,第三點就是網絡掉線故障發生之后很短的時間內能夠自動恢復正常。
從以往經驗來看,筆者認為網絡要是頻繁發生掉線的話,那可能有兩個方面的原因,一個方面的原因就是網絡線路自身連接不穩定,另外一個方面的原因就是局域網中可能存在蠕蟲病毒,這個蠕蟲病毒或許就是導致網絡頻繁發生掉線故障的原因。由于筆者單位的局域網是通過本地電信部門的ADSL設備進行共享上網的,于是筆者立即與本地電信部門進行了聯系,懇請他們能夠對本單位的ADSL撥號上網線路進行檢查,結果他們回復說沒有任何問題,本單位的ADSL撥號上網線路一切正常,于是筆者排除了網絡線路自身連接不穩定因素,并且將故障解決的重點放到了網絡蠕蟲病毒身上;因為當局域網環境中蠕蟲數據包非常多的話,很可能導致寬帶路由器設備發生“假死”現象,從而可能會將相關的網絡端口關閉掉,如此一來可能就會導致網絡掉線故障,而當網絡蠕蟲病毒不發作時,那些被關閉的網絡接口又會自動打開,這樣一來網絡掉線現象過一段時間后就能自動恢復了。
既然筆者已經認定間歇性斷網故障是由網絡蠕蟲病毒引起的,那么筆者就準備開始認真重新排除局域網中是否真的有病毒。大家知道,目前網絡中流行的許多蠕蟲病毒,特別是ARP類型的網絡欺騙病毒,它們的傳播速度是非常快的,并且破壞力非常強,只要局域網中任意一臺工作站被ARP類型的網絡欺騙病毒感染,那么局域網中所有工作站的網絡連接操作都會受到明顯的影響。依照這樣的分析,筆者對局域網中所有同事使用的工作站系統又重新檢查了一遍,的確沒有找到任何可疑問題。而且在局域網發生網絡掉線現象時,筆者通過“arp -a”字符串命令查詢了本地網絡的ARP緩存表,結果發現緩存表中列寫出來的網關MAC地址信息與局域網處于正常上網狀態時的是一致的,這個結果表明局域網網絡掉線故障并不是由于ARP病毒欺騙造成的。
故障解決
根據上面的各種理論分析與實際檢查,筆者基本已經推翻了間歇性斷網故障是由網絡蠕蟲病毒引起的這個結論了,那么究竟還有哪些因素可能導致單位局域網網絡每隔一段時間就會自動發生一次掉線故障呢,而且要不了多長時間后又能自動重新恢復連接呢?
為了更好、更快地將網絡故障原因找到,筆者打算采用最簡單、最常用的故障排查方法來解決難題,那就是采用分割法尋找故障原因,換句話說就是將局域網中各個工作區域分別隔離開來進行檢查。首先筆者先將局域網中所有工作站的電源全部關閉,讓所有工作站都從局域網中斷開,并且只連接一臺筆記本電腦到局域網中,可是該筆記本電腦在上網的時候仍然出現了相同的網絡掉線故障。很明顯,間歇性斷網故障不是出現在局域網工作站上,筆者估計問題很可能發生在局域網的交換機設備或路由器設備,或者出現在與這些設備相連的網絡連接線路上。
為了檢驗局域網中的交換機設備是否能夠正常工作,筆者索性將筆記本電腦直接連接到局域網的路由器設備上,之后在筆記本電腦上重新進行了上網測試,可是最終的測試結果還是讓筆者非常失望,筆記本電腦仍然過一段時間就發生了網絡掉線現象,而且沒有多長時間又能自動恢復正常;根據這一測試結果,筆者認為間歇性斷網故障與交換機設備沒有任何關系,而多半與路由器設備或與路由器相連的物理線路有關系。
之后筆者又將筆記本電腦與ADSL設備直接相連,而跳過了局域網中的路由器設備;緊接著筆者又在筆記本電腦中采用手工方法重新創建了撥號上網連接,再用鼠標雙擊該撥號連接圖標嘗試進行上網訪問,結果筆者看到網絡自動掉線現象一直沒有再出現,這就意味著網絡撥號上網線路是正常的,并且這也驗證了ADSL設備不存在任何故障。在逐步排查、篩選之后,筆者認為間歇性斷網故障肯定是由寬帶路由器自身設置不當引起的,當然也可能是由寬帶路由器自身質量不穩定引起的。
正常情況下,寬帶路由器設備質量上面一般不會有什么問題,問題很可能發生在參數設置上。于是筆者打開IE瀏覽器窗口,并在該窗口地址欄中輸入寬帶路由器設備默認的IP地址,之后又輸入該設備系統管理員帳號與密碼,登錄進該設備的后臺管理界面,在該后臺界面中筆者認認真真地檢查了各項設置參數,結果看到在“網絡參數”處,“WAN口設置”下面的撥號設置參數被修改為了“按需連接,在有訪問時自動連接,自動斷線等待時間5分鐘”了,這一參數設置說明當單位局域網中有用戶要訪問Internet網絡時,寬帶路由器設備才會自動進行撥號上網,而且當局域網網絡在5分鐘之內沒有任何用戶使用時就會自動發生掉線故障。找到故障原因后,筆者立即將“WAN口設置”下面的撥號設置參數修改為“自動連接,在開機和斷線后自動連接”,并重新啟動了一下寬帶路由器設備,結果單位局域網中再也沒有發生間歇性掉線故障。
故障小結
總結上面的故障排除過程,筆者認為許多事情千萬不能想當然,否則很容易多走彎路。這不,在本則故障的排除過程中,筆者認為寬帶路由器設備的工作參數一般沒有人會隨便去改動的,于是就沒有想到要對該設備的參數進行檢查,可誰曾想到這則網絡故障竟然是由寬帶路由器設備上的WAN口撥號連接參數設置錯誤引起的,于是筆者懷疑是前任同事離開單位時做的手腳。當單位局域網在五分鐘之內沒有任何用戶訪問外部網絡時,寬帶路由器設備就會自動將連接外網的線路切斷了,當有人嘗試進行網絡訪問并發現無法上網時,寬帶路由器設備又會根據“按需連接”方式自動將斷開的網絡線路恢復成功,這樣就出現了過幾分鐘后網絡又能重新正常工作的現象。
【編輯推薦】