華為HC發布AIOps系列云服務,使能新基建運維智能化轉型
原創【51CTO.com原創稿件】2020年9月25日,第五屆華為全聯接2020大會順利進入第3天議程。在媒體圓桌現場,華為隆重推出AIOps系列云服務,聚焦提升電信運營商和企業專網的智能化運維能力,引發業界極大關注。
媒體圓桌發布會現場
華為網絡人工智能產品部CTO程磊現場發布AIOps系列云服務
2020年,隨著5G商用與“新基建”的加速實施,聯接、云、AI、計算和行業應用史無前例地匯聚到一起,為數字經濟發展注入了新動能。但在千行百業不斷對數字化轉型按下“加速鍵”的同時,華為強調“欲善新基建,必先利運維”。尤其在電信行業,華為認為運維能力的演進成為電信網絡能否持續發揮效能的關鍵因素。
電信網絡運維難度指數級增長,AIOps被給予厚望
華為這番觀點深得電信運營商的認同。事實上,在運維支撐系統的演進方向上,“構建 AIOps 平臺能力,運用AI技術支撐不同運維場景應用”也已經成為電信行業運維智能化轉型的趨勢和共識。
之所以電信行業如此積極擁抱AIOps,最關鍵的原因就在于現有的運維瓶頸已經不是簡單增加人力,培養運維專家就能化解的。更何況運維效率低下帶來成本激增,也極大地拖慢了運營商轉型的步伐。以新應用上線為例,在當今競爭激烈的市場大環境下,新的功能應用必須以“快”為先,但是不少電信行業的OSS系統獨立,新應用上線周期長達數周甚至數月,這顯然不能滿足市場用戶的需求。再看看運維工作里最常見的故障定位與恢復:過去故障診斷往往依賴個人經驗,準確率低,并且往往是用戶投訴了才知道出現了故障。這在5G新基建時代顯然行不通了,因為網絡更加復雜,牽一發動全身,僅僅憑借個人經驗根本不足以應付如此復雜的網絡狀況,故障處理時間長效率低,純人工運維模式+個人經驗主義委實難以為繼。
在這樣的形勢下,AIOps被看做是化解網絡運維復雜度,提升業務質量和用戶體驗的一道“良方”。而華為本次推出的AIOps系列云服務,不僅包括了括故障識別根因定位服務、日志異常檢測服務,還提供KPI異常檢測服務,硬盤異常檢測服務,可以說是為電信行業和企業專網用戶量身訂制,讓運維實力再上新臺階。
華為分享AIOps成功落地兩大關鍵點
事實上AIOps并不是一項新技術,早在2016年,Gartner就已正式將AIOps定義為新的運維類別。當時業界普遍認為運維與AI有天然的結合優勢,既不需要數字化轉換,也對數字采樣沒有太高要求,最關鍵的是運維領域的日志、配置、操作、腳本、程序等都是計算機自動生成的,這恰恰是AI處理的強項。但這幾年過去了,AIOps卻并沒有預想中那樣“混得風生水起”,這究竟是什么緣故?
華為指出,電信領域的AIOps落地的關鍵有兩點:第一點是需要將行業知識與AI技術融合,只有當AI算法與電信領域行業知識真正融合后,才能擁有更優質的電信領域模型參數,徹底解決此前通用算法模型在電信行業落地效果差的難題。第二點,網絡運維系統的AIOps能力構建的趨勢是業務與能力解耦,要做到AIOps能力的復用、拉通,支持,才能適配運維場景應用百花齊放和快速上線迭代的需求。
四大核心功能令華為AIOps“技高一籌”
那么,秉持著華為對電信領域智能化運維思考,華為AIOps云服務究竟有何不同呢?這就不得不提華為AIOps的四大核心能力:
核心能力一:提供豐富的AIOps原子能力。NAIE AIOps的原子能力覆蓋運維全流程,包括預測、檢測,定位、執行,目前提供20多種原子能力,支持流量預測、KPI異常檢測、日志異常檢測、CHR異常檢測、異常關聯分析等服務。
核心能力二:組合編排與DevOps能力。華為可以幫助電信行業零編碼定制場景組合應用,例如KPI異常檢測服務、故障識別與根因定位服務、日志異常檢測服務、硬盤異常預測,都已經成為華為AIOps預組合編排好的服務,支持運維人員“開箱即用”。
核心能力三:支持電信領域數據對接。華為AIOps 使能服務提供通用的數據源對接和標準化數據治理組件,支持 KPI 、告警、日志、xDR 等電信領域主流運維數據,還支持 Kafka、數據庫、文件系統、Restful 等電信運維系統的主流數據對接方式。
核心能力四:提供場景組合服務。圍繞運維全流程(發現、分析、處理)提供預制典型場景組合應用,快速接入運維流程。
華為AIOps賦能運維智能化未來
如今,作為自動駕駛網絡AI引擎iMaster NAIE的核心能力,華為AIOps使能服務已經在電信行業的無線、核心網、數通等網絡域得到了廣泛應用與規模驗證。在實踐中,華為AIOps幫助運營商打破原有的煙囪式建設方式,將各專業運維系統的應用與AI能力解耦,通過AIOps能力來適配運維場景應用百花齊放的需求。
在電信網絡中,通過KPI來預測和檢測網絡問題是最普遍的場景。華為AIOps能夠通過AI算法基于歷史數據自動生成每個KPI 的動態門限,并且提供異常原因的關聯分析。如此一來,一旦發生KPI故障,華為AIOps就能幫助運維人員快遞鎖定故障點,并且模型還可以進行自學習調優,不斷演進優化。國內某運營商采用了核心網 KPI 異常檢測服務以后,實現提前 5 小時識別異常并主動預警,降低了業務損失。
不僅如此,發現異常或者故障之后的定位是運維流程中的難點,如何準確的將多維度的異常、告警等事件進行匯聚,減少故障噪聲,準確定位到具體原因?傳統運維中,這些工作主要依賴于專家經驗或者手工分析,而且受限于分析算力和知識信息,效果并不理想。華為 AIOps 通過 AI 算法與業務的融合,支持多類異常/告警等事件的智能故障定位,能夠為運維團隊提供多維度的事件匯聚和根因定位。經過實際驗證,無效上站減少 60%,根因識別準確率 85%+,運維效率整體提升 15%,令運營商非常滿意。
Tractica/Ovum 預測,到 2025 年,全球電信業對人工智能軟件、硬件和服務的投資將達 380 億美元 , 成為最大的 AI 應用市場。在中國,三大運營商也早已在人工智能領域布局,相信隨著新基建的深入,電信行業有望再次騰飛。有理由相信,華為AIOps系列云服務將為電信行業注入更高效的運維支撐能力,加速電信行業變革。
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】