AIOps實踐三板斧:從可視化、自動化到智能化
原創2018年5月18-19日,由51CTO主辦的全球軟件與運維技術峰會在北京召開。此次峰會圍繞人工智能、大數據、物聯網、區塊鏈等12大核心熱點,匯聚海內外60位一線專家,是一場高端的技術盛宴,也是***IT技術人才學習和人脈拓展不容錯過的平臺。
在“容器下的AIOps”分會場,新炬網絡董事、副總經理程永新做了主題為《AIOps實踐三板斧:從可視化、自動化到智能化》的精彩演講。程永新從事運維管理工作近二十年,歷經了IT技術架構、運維管理模式與工具的變遷,本次演講闡述了企業級AIOps的演進路線,從實際場景進行突破,圍繞AIOps落地展開。
AIOps平臺產品化之難何以突破
在移動化、大數據、云計算、人工智能等新技術的推動下, IT技術架構悄然變遷, 從傳統“IOE架構”走向“互聯網架構”。互聯網架構所涉及的網元數、技術棧、服務數等元素成倍劇增,使得運維壓力越來越大。這樣的趨勢下,運維管理模式從ITIL向DevOps演化,運維管理工具也發生了從ITOM、ITOA到AIOps的顛覆性變革。
雖然Gartner給出了AIOps平臺市場指南,但是依照數據管理、模式算法、場景驅動這三要素進行,AIOps平臺就能實現落地嗎?其實不然。在這個過程中會遇到多重困難:其一,擅長開發的開發人員不擅長運維,擅長運維的運維人員不擅長開發;其二,規模不一的諸多歷史系統縱向經歷過幾次迭代、橫向經歷過多大規模,是否能與AIOps***兼容?其三,AIOps平臺產品化需要既能兼顧歷史與未來需求,又能滿足靜態穩定與敏捷發展需要,還要能跨越規模與行業的界限。
新炬網絡自2006年成立至今,一直在為電信、電力、航空、金融等大型企事業單位提供運維管理服務。結合行業實踐經驗,程永新提出了AIOps落地三板斧:從可視化、自動化到智能化,以新炬網絡建設AIOps智能運維平臺做示例,證實了場景驅動是實現AIOps落地的***方式。
AIOps落地三板斧之可視化
可視化為何如此重要,成為***板斧?原因在于可度量是一切管理的開始,可視化是管理結果的呈現。在AIOps落地過程中,不可或缺的環節是盡可能量化更多的指標,并且實現指標可視化。在這個過程中,企業需要構建立體的可視化監控體系,進而實現從業務到資源的立體、深度關聯分析。
圖1新炬網絡可視化智能監控體系框架圖
如圖1所示,新炬網絡的智能監控告警系統通過對操作系統、數據庫、虛擬化、網絡設備、中間件、存儲等進行統一數據采集,讓用戶通過監控大屏即可實時查看系統各指標情況。此外,通過智能算法構建的可視化健康度模型,還將系統監控簡化成智能打分形式,簡化監控決策。
AIOps落地三板斧之自動化
AIOps落地的第二步是自動化,對于大量的頻繁操作,如安裝、部署、補丁下發、巡檢操作等,都可以用自動化的方式來減少運維人員的工作量。
AIOps場景:故障分析自動化
圖2 實時故障路徑分析
如圖2所示,在自動化處理過程中引入大數據和智能分析能力,實現運維實時故障路徑分析、快速定位故障的能力,并能對復雜系統的“點、線、面”故障影響度進行分析。
AIOps場景:數據庫運維自動化
圖3 數據庫智能運維與智能SQL優化
所有的PaaS核心在于數據庫,而數據庫運維的工作又在整個生產運維中占非常大的比重。如圖3所示,新炬網絡針對性地推出了DPM數據庫智能運維平臺,目前已經支持Oracle、DB2、MySQL、SQL Server等多種常見數據庫,實現一個平臺多種數據庫的智能運維管理,可快速發現問題、定位問題、提供優化建議,還可以對應用版本變更過程引發的SQL問題,提出針對性的優化建議、對高危SQL進行自動識別與審核,降低應用上線帶來的風險。
AIOps落地三板斧之智能化
走過了可視化、自動化階段,就解決了企業80%的運維問題,那么接下來如何走向智能化?突破口在于場景驅動。新炬網絡根據自身在企業級運維服務市場深耕十余年的經驗,總結出智能巡檢、資源管理、應用容量、網絡安全、用戶體驗、故障診斷、容災切換、安全審計這八大運維場景,均可從自動化走向智能化。
圖4 智能化落地前提:運維大數據
如圖4所示,程永新特別強調了運維大數據的關鍵作用,它是智能化落地的前提。以新炬網絡為例,當有了統一采集、多維立體的可視化監控體系,實現了八大運維場景自動化之后,基于新炬網絡自主研發的IVORY大數據日志分析平臺,發力AIOps實時運維數據分析,從而實現故障的提前預警、異常隱患的及時發現及趨勢分析。IVORY結合了多年的行業運維經驗沉淀,逐步探索出了告警自愈、故障自動恢復等能力,并在移動運營商和金融行業實現了生產實踐。
新炬網絡AIOps企業級實踐與演進路線
新炬網絡AIOps企業級實踐與演進路線整體分為三個階段:運維平臺基礎能力、運維大數據和工具能力,以及AIOps能力及場景落地,每個階段的相關建設與舉措如圖5所示。
圖5 新炬網絡AIOps企業級實踐與演進路線圖
在演講過程中,程永新還提及到新炬網絡助力多家金融企業客戶實施AIOps落地的案例,包括針對全國性商業銀行數據庫實施的智能運維、針對金融風控數據部署的大數據分析應用,以及為金融企業提供的整體AIOps智能運維平臺等。在金融行業信息化建設層面,新炬網絡堅持“企業級產品+本地化服務”的雙輪驅動戰略,在其十余年大型企業運維服務經驗中厚積薄發,推動金融科技創新、加快新技術在金融行業的應用。