AIOps“入坑”之前必須了解的知識
AIOps憑借著強有力的表現在行業中引起廣泛的關注與支持,已經有充分理由證明,AIOps也許將為我們開啟一扇新的大門,在AI的支持下高效發現并處理基礎設施運營領域的種種常見問題。
AIOps(人工智能與運營)是指在IT運營當中引入AI算法,借此解決網絡當中不斷增長的數據與復雜性難題,同時緩解IT預算緊張帶來的長期壓力。AIOps解決方案與谷歌地圖或者Uber的出行價格預測模型采用相同的機器學習與高級分析技術,能夠幫助IT部門在用戶感受甚至意識到故障之前,就搶先完成預測與基礎設施修復。
在這樣的AI自主修復網絡當中,用戶將享受到穩定的性能體驗,企業不再需要為了“維穩”而投入大量寶貴IT資源。AIOps在保障無線網絡運行速度與可靠性方面的表現尤其突出。時至今日,Wi-Fi已經與供水、供電與照明等基礎保障系統一道,成為我們日常生活中必不可少的一部分。而在這個高度移動性、應用程序驅動型時代下,企業也開始以無線網絡為基礎設計并構建面向消費者及內部員工的服務組合。因此,無線網絡連接必須比以往任何時候都更加可預測、可量化且易于管理。
換言之,企業需要對流經無線網絡的PB級數據建立起更好的可見性,并根據由此獲得的洞見實時、主動甚至自動調整其基礎設施,避免故障及性能優化問題影響到用戶體驗。企業如何利用AIOps作為這種新型自主運行網絡的實施基礎?我們不妨從以下五項優先事務出發。
第一,選擇真正的AI解決方案。
與自動駕駛汽車及醫療診斷系統中的AI系統一樣,IT運營領域的真正AI方案必須能夠隨時間推移而不斷分析更多數據,借此提升自身智能水平并持續增強其自動監控并修復網絡問題的能力。
目前市面上不少AI解決方案,在本質上只是一種花哨的數據收集或數字運算產品。它們雖然能夠高效收集并分析統計數據,但實際使用的底層AI技術與自動駕駛汽車等并不相同。因此,企業需要認真考量選定的AIOps平臺,保證其中包含以下要素:1、數據管道:支持從多種數據源處獲取數據;2、AI原語:向數據當中添加特定領域專業知識的能力;3、數據科學算法庫:在工具箱中提供深度學習選項;4、易于上手的用戶界面:只有可供業務員工快速使用的解決方案,才是實現數據科學大眾化的可行載體;5、對CIO們來說,了解不同平臺之間的差異并制定出將AIOps納入網絡自動運行策略將非常重要。
第二,數據協調。
高質量的AI模型離不開清潔的集成化數據。AI系統需要分析數據并從中學習種種特征,而如果遍布企業內部的WLAN、WAN、路由器、防火墻等要素之間無法實現數據共享與關聯,我們將永遠得不到準確可靠的模型方案。因此,企業必須消除整個IT堆棧內的一切數據孤島,將多種不同系統整合成統一的數據共享整體。
第三,建立正確的技能儲備。
AIOps對于IT人員代表著一波重大變革,從配置框命令行界面、到用于從數據中獲取洞見的API編程模型,都在挑戰內部員工的以往工作習慣。在傳統上,大多數網絡管理員的主要培訓內容都集中在配置硬件方面。但對AIOps來說,這還遠遠不夠。員工們需要掌握更廣泛的技能,從各類設備中獲取數據,并將其轉化為通用且可互操作的格式以供AI系統使用。
CIO及其他企業高管當然需要了解其中的區別,并在招聘、任用與再培訓等方面做出相應調整。總而言之,沒有強大的開發技能作為基礎,AIOps永遠發揮不出應有的作用。
第四,了解AIOps與分布式軟件云架構之間的密切聯系。
人們所熟悉的第一代云托管端點技術,在本質上是由采用嵌入式軟件架構的本地控制器所組成。雖然這種結構能夠讓無線網絡的部署與管理變得更為輕松,但未來的自主運行網絡更需要分布式云軟件架構的支持,由此保證我們可以隨時添加新的AI模型。
從這個角度看,希望采用AIOps的企業需要推廣分布式微服務架構,允許在網絡的各個層面應用新的算法,借此實現跨部門可見性并快速實現維修與新功能。
第五,擁抱云計算。
雖然企業在銷售、人力資源、財務及其他業務領域已經開始積極引入云要素,但網絡層面的云升級速度一直比較遲緩。CIO們必須意識到,云是AIOps的最佳搭檔。云計算能夠提供極具可擴展性的基礎設施,用于從無線網絡數據當中提取并推理出可行洞見。
通過這五個基本步驟,企業有望充分發揮AIOps的強大威能,由此構建起更易于運營、且使用感受更為友好的自主運行網絡體系。