輕松解決寬帶網絡疑難雜癥
"望聞問切"是中醫診病的常用手法,也是沿用了數千年的一個醫病良方。在寬帶網絡架構漸趨復雜化的今天,各種疑難雜癥也紛紛光顧。可是,很多寬帶網絡的維護人員卻一直沒有找到解決這些疑難雜癥的良方。從技術角度來講,無論何種寬帶故障,只要細心觀察故障現象,解決寬帶故障并不難,如同中醫診病一樣,對于寬帶網絡疑難雜癥,同樣需要望聞問切。
下面,筆者結合幾例非常經典的寬帶網絡故障,講述一下如何用"望聞問切"的方法解決寬帶網絡的疑難雜癥。
1、固定IP的ADSL無法上網
故障表現:為了優化ADSL寬帶網絡,將原有充當路由功能的三層交換機改為數據透傳。升級完成之后,ADSL寬帶用戶可以直接由DSLAM節點透傳到BAS服務器,可是,升級完成之后,固定IP的ADSL用戶無法上網,而PPPoE虛擬撥號用戶則正常。
圖一 ADSL寬帶網絡拓撲
故障解析:經過改造之后,數據的走向如上圖所示。PPPoE虛擬撥號用戶可以上網,而固定IP的ADSL用戶無法上網,從這一故障表現可以看出,固定IP用戶的數據可以直接透傳到BAS服務器。無論PPPoE虛擬撥號的ADSL用戶,還是固定IP的ADSL用戶,都需要在BAS上進行身份驗證。PPPoE虛擬撥號用戶需要提供帳號和密碼,而固定IP的ADSL用戶需要提供固定IP是否可用,以及該固定IP用戶在DSLAM節點的VLAN標簽即Tag值。
由于該固定IP的ADSL用戶無法上網,其故障點可能在數據透傳或BAS驗證兩個方面。通過對故障的"望"和"聞"之后,必須問一下用戶端的癥狀,以進行故障定位。據該固定IP的ADSL用戶反應,在路由器中,可以看到寬帶網絡局端的MAC地址,在寬帶運營商的網管系統中,也可以看到該固定IP的ADSL用戶的MAC地址。顯然,該故障并不是因為數據透傳引起的。
通過一番對比之后,將寬帶故障鎖定在BAS驗證這一環節。過去,固定IP的ADSL用戶,其數據通過一臺三層交換機轉發,DSLAM節點處只有一個Tag值。數據透傳之后,原來有三層交換機負責進行IP地址驗證轉由認證服務器來做,而DSLAM節點的數據仍然僅僅是一個Tag和MAC地址,沒有該名用戶相應的IP地址信息。對于固定IP的ADSL用戶而言,寬帶運營商分配的IP地址是數據的通行證,沒有IP信息,數據是不能通過BAS服務器的。
在寬帶運營商的網管系統中,將該固定IP的ADSL用戶的IP地址和MAC地址綁定在DSLAM節點中,認證服務器就可以完成對該用戶的身份認證,故障也得以解決。
故障點評:在上述故障的處理中,對該名用戶故障的查看就是"望"和"聞",詢問用戶無法上網的表現是"問"。通過分析寬帶接入的原理,結合故障表現,稱為"切"。不難看出,只要熟知工作原理,了解每個數據傳輸的流程,解決寬帶故障并不難。#p#
2、ADSL寬帶用戶有規律的掉線
故障表現:近日,客服熱線方面反應,有一個小區的ADSL寬帶經常有規律的掉線。掉線時間通常在晚上7點半左右,掉線可以持續2個小時左右。周六和周日也會有掉線,而且掉線頻率比平時要高一些。
故障解析:由于掉線的故障是通過客戶熱線轉過來的,加之客戶對于掉線的并沒有一個準確的認識,"掉線"故障必須要問清楚。從客戶熱線的數據可以看得出來,反應ADSL寬帶有規律掉線的用戶,全部是一個DSLAM節點的用戶。
晚上8點到9點之間,從網管系統查看DSLAM的狀態,發現用戶是經常掉線,是用戶手工強制斷開的。詢問用戶得知,晚上或者周末上網時,打開一個網頁經常需要涮新幾次才可以,重新斷開撥號連接之后就沒有此故障。從技術角度講,用戶反應的有規律"掉線"其實是數據流隊列太長所致,并非真正的掉線。仔細查看與DSLAM節點相連的三層交換機的日志不難發現,來自該DSLAM節點的數據流比較大,校驗數據占總流量的20%左右。
圖二 交換機各端口流量圖
故障的根源找到了,大量ADSL用戶上網時,DSLAM節點的數據流量會增大,其中一些數據通過三層交換機傳輸時,校驗包的增多,造成網絡數據傳輸的擁塞。
造成DSLAM節點數據傳輸擁塞的原因,無非是因為DSLAM節點與三層交換機傳輸協議不一致,或者是端口速度不協調。在網管軟件中查看得到,三層交換機分配給DSLAM的端口傳輸狀態是100Mbps Full,而DSLAM節點的光貓狀態是10/100Mbps自適應。將傳輸狀態改為一致的傳輸模式后,故障解決。
故障點評:目前,很多ADSL用戶并不明白什么是掉線,什么是數據斷流,什么是數據擁塞,為此,寬帶維護人員必須親自查看用戶掉線時的具體表現。查看用戶掉線的表現,如同中醫診病的"望"一樣重要。#p#
3、DSLAM節點工作狀態不明
故障表現:一個星期日的中午,某分局局長打過來電話,稱該分局的轄區內的幾個單位全部無法上網,所有用戶都在打電話投訴無法上網。進入網管系統,發現DSLAM節點已經狀態不明,查看與其相連的交換機,發現與該DSLAM節點相對應的端口沒有數據流量。
故障解析:由于該區域內的所有ADSL用戶無法上網,而且在網管系統內無法查看到DSLAM節點的工作狀態,通過以上表現不難看出,故障的根源可能是局端機房的網絡設備。供電系統,網絡系統或者是DSLAM節點,都有可能出現故障。
為了進一步弄清楚故障點在哪里,必須詢問ADSL用戶具體情況,無法上網有很多原因,到底是哪一種原因導致ADSL無法上網。通過詢問得知,所有ADSL用戶的寬帶Modem無法上線,也就是說,ADSL線路無法激活。看來,是DSLAM節點故障了。
由于網管系統已經無法查看到DSLAM節點的工作狀態,也就無法令其重新啟動。維護人員趕到現場之后,發現DSLAM設備的指示燈呈現黃色,而且在閃爍狀態。將DSLAM的電源關閉,五分鐘后重新啟動,DSLAM設備仍然無法正常工作。難道是DSLAM設備出現了故障?
圖三 交換機溫度及風扇狀態
從網管系統對該機房的所有設備進行檢測,發現該機房的溫度和濕度都不在正常的范圍之內,難道是溫度過高所致?立即通知維護人員檢查空調的運行狀態,發現空調盡管在致冷狀態,溫度也在24度的恒溫,可是,空調的致冷效果并不好,機房內的溫度已經升高至33度左右。啟動備用空調,溫度降低到24度之后,DSLAM設備正常啟動了,至此,故障排除。后來,查閱DSLAM的說明書得知,DSLAM有一項過熱保護功能,當整體溫度達到一定的溫度之后,DSLAM會進入休眠狀態。
故障點評:盡管通過"望聞問切"的方法,找到了故障的根源是在DSLAM節點上。可是,維護人員一味的查找設備的問題,卻忽略了設備的工作環境。電信級別的網絡設備,對于工作環境的要求非常苛刻,溫度要適中,濕度也要合適。為此,在遇到網絡設備無法工作時,首先要查看設備的工作環境。
寫在最后:從以上三則寬帶網絡經典故障的處理過程可以看出,查看網絡故障表現必須要細致,更要細致的觀察客戶端與服務器端的故障表現。要想輕松解決寬帶網絡的疑難雜癥,"望聞問切"的步驟一個都不能少,因為給網絡診病如同中醫為人醫病是一樣的道理。
【編輯推薦】