IP網絡的可視化運營
三個“不可視”
由于IP網絡運維存在三個“不可視”,存在黑匣子現象,導致運維效率低。
首先,承載的業務品質不可視,不能感知終端用戶體驗。
傳統網管只能提供網絡的性能,看不到內容的承載質量,網絡性能與業務品質是分離的,業務部門和網絡部門認識故障的維度不統一,沒有統一的度量尺度,造成故障定位需要跨部門專家協同工作,人員技能要求高,故障定位效率低,互相推諉責任的現象時有發生。
其次,路由不可視,看不到業務路徑。
IP網絡引入動態路由,三層網絡是一片云,看不到業務的路徑。路由不可視導致在IP網絡運維過程中,經常出現終端用戶申報了故障,而當運維人員進行故障定位時,故障又消失了,故障無法重現,又沒有歷史信息可以查詢,無法找到故障原因,無法徹底解決用戶的問題,造成排除故障隱患困難,并且需要高水平的數通專家參與故障定位。路由不可視還導致運維人員無法預防路由振蕩引起的全網故障,路由振蕩對網絡的影響是災難性的,最壞可以引起網絡癱瘓。
第三,端到端管道不可視,創建過程復雜,且狀態不可視。
端到端管道的創建過程需要跨域部署,并且配置內容復雜,傳統的單域網管不能實現可視化的高效下發,下發后也不能看到IP管道的狀態。在業務部署過程中,需要運維人員全盤考慮每個節點上業務部署的參數和參數之間的相互關系,一旦發生參數配置錯誤,也很難檢查和糾正,對IP運維人員的專業技能要求高。
面對上述難題,運營商的網絡運維部門往往很是頭疼。難道IP網絡的可靠性真的很低嗎?
探索解決方法
其實,IP網絡的可靠性并不是無法解決。在IP網絡運維中,我們需要一個很重要的思想轉變,即從被動運維轉為主動運維。
相比以前接到終端用戶投訴再進行網絡故障檢測的被動運維模式,IP網絡的運維要求更高,需要運營商根據網絡的日常運行狀況提前預警網絡的薄弱環節,提前預防。因此,運維模式的轉變在All IP化道路上顯得非常重要,那么到底什么樣的主動運維才符合IP網絡呢?
主動運維要求實現對終端用戶的業務體驗監控,運維人員周期性地收集網絡性能和業務品質數據,并通過分析數據,將其中的趨勢內容挖掘出來,對潛在的故障點和薄弱環節進行預判斷,使運營商可以提前感知終端用戶的業務體驗程度,預先判斷業務是否會發生劣化,并提前解決由此帶來的一系列問題,從而降低終端用戶投訴,提高客戶忠誠度,并降低運維成本。
運營商在運維系統的投資驅動力的分布情況,驗證了IP主動運維的必要性。Gartner的調查結果表明,“主動預防網絡性能問題”是當前運營商首要的運維投資驅動力,占整個投資的27%,而“快速網絡故障診斷”、“業務質量保障SLA”分別排在第二、第三位,其投資驅動力分別為15%、12%。
IP網絡運維有以下三個要求:快速解決故障,即當網絡和業務出現故障時,需要快速解決問題,實現迅速的故障定界和定位;主動預防問題,即對業務質量和網絡性能實時監控,及時發現問題,IP承載網的故障需要關聯到被影響的業務上,并通過趨勢分析,提前做出預警;網絡日常管理,即建立網絡質量監控和健康評估系統,通過整套的KQI/KPI指標體系來反映和管理用戶體驗,掌握網絡的實際運行狀態,不斷提高終端用戶的忠誠度。
可度量,才可管理;可管理,才可改進。在網絡IP化后,最先需要解決的問題就是可度量,即IP運維要做到可視。
IP網絡的“儀表盤”
IP網絡的管理方法是多種多樣的,但只有充分跟業務關聯,關注QoE指標,真正實現IP網絡運維的可視化,才能保證網絡的可靠性,才能更好承載各種業務。華為開創IP網絡可視化的業界先河,成功實現IP業務質量、路徑和部署的可視化,徹底解決IP運維的黑匣子問題。
U2520是華為公司最新推出的IP網絡業務保障系統,支持寬帶承載、移動承載、IP Core解決方案,由業務監控系統和網絡評估單元兩部分組成。
業務監控系統可以實現網絡質量監控、業務質量監控、按需測試、閾值告警管理、探針管理、系統管理和報表管理功能。網絡評估單元是盒式外置探針,可以部署在網絡接入層和匯聚層,實現對網絡和業務性能數據的采集并上報給監控系統。
華為U2520被譽為IP網絡的“儀表盤”,其技術優勢體現在以下兩個方面:
IP轉發平面可視:感知IP承載業務品質,全面監控IPTV、VoIP、HSI、VPN業務,真實反映終端用戶的業務體驗,通過業務承載質量的逐段對比,實現基于業務的故障的定界和責任劃分,便于維護人員對IP轉發平面的故障進行快速處理。IP網絡運維部門和業務運營部門擁有相同的QoE指標,業務故障的界定一目了然。
IP控制平面可視:IP業務有了路徑,自動計算并顯示業務路徑,監聽和分析路由變化,預防路由振蕩引起的全網故障,用于維護人員對IP控制平面的故障進行快速分析、預警和定位。
IP轉發平面可視和IP控制平面可視相結合,轉發平面主動模擬業務報文測試過程,可以結合業務路徑進行測試。一旦三層業務路徑發生變化,轉發平面的測試也動態調整,轉發平面的測試也就可以實現對業務承載的自動化監控管理;一旦發現業務承載質量有劣化趨勢,即可自動觸發智能專家診斷系統,在短時間內發現劣化的根因,并通過專家診斷系統給出問題處理建議,將IP網絡運維效率大幅提升,并可以像SDH網絡運維一樣實現主動運維,通過運維效率的改進,提升網絡競爭力,并有效提高終端用戶的滿意度。
在全面監控IP轉發平面和控制平面的基礎上,華為U2520提供完善的指標體系,提供網絡健康評估系統,并提供運維工作的評判標準,提高網絡運維能力。通過指標體系的分析統計,基層運維人員能夠在解決眼前問題的同時,發現問題產生的根源,并針對性地加以改進,以規避人為因素導致的一些故障,從而實現運維效率的持續改進提升。
U2520還能實現業務監控全網化,提供多廠商設備組網的業務品質監控解決方案,滿足運營商各種組網環境的監控要求。
值得一提的是,與U2520共同使用的華為U2000網管系統,支持E2E業務參數的資源池管理,通過點擊源、宿節點即可完成E2E業務的自動創建,系統動態分配業務參數,自動管理各網元上E2E業務參數之間的邏輯關系,自動檢查配置,自動校驗通斷,一次開通業務,并支持一站式多網元批量配置,端到端業務發放VPN,端到端可視操作,管道質量可視化展現,易學易用。
自2009年第三季度正式推向市場后,U2000在全球的應用進入了一個快速增長期,截至目前,已在歐洲、北美、亞太、澳洲等地區的30多個主流運營商實現了規模部署,其中包括中國移動、中國聯通、Vodafone、DT、FT、Telefonica、Swisscom等全球領先運營商。