下一代的DevOps服務:AIOps
譯文【51CTO.com快譯】AIOps是什么以及了解下它可以如何幫助您的IT部門,例如,利用它來快速處理所有數據。
AIOps是一個總稱,用于指代使用復雜的基礎設施管理軟件和云解決方案監控工具來實現自動化數據分析和日常的DevOps操作。
那些10年前甚至是5年前構建的系統監控工具的主要缺陷是它們不是為了滿足大數據時代的需求而構建的。它們既不能處理數量龐大的輸入數據,也不能處理種類繁多的數據類型,更加不能與輸入數據的速度保持一致。根據以往的經驗,這樣的云監控解決方案必須將數據分塊,將看似重要的內容進行分離,并切斷看似不需要的內容,***使用焦點組和統計樣本進行操作,而不是處理整個完整的數據。
這樣做的結果是,在數據分析階段,一些重要的模式可能會被忽略,數據可視化的視圖被完全排除。這可能使得整個過程毫無用處,就好像大數據分析不能產生可操作的業務洞察一樣,它將無法提供大數據分析中最重要的價值。
讓AIOps進入場景
當然,要及時處理所有機器生成的數據是不可能的。然而,這正是人工智能算法(如深度學習模型)所擅長的那種任務。剩下的唯一問題是:如何在DevOps工程師的日常生活中讓這些機器學習工具發揮作用?
下面是在IT部門中適合使用AIOps的一些案例:
- 快速處理數據。可以訓練一個ML模型來處理系統生成的所有類型的數據——這是未來的方向。如果必須添加新的數據類型,模型也可以相對容易地進行調整和再訓練,以保持高性能。這將確保數據的完整性和保真度,從而產生全面的分析和具體的結果。
- 深入的數據分析。當你能夠實現對所有數據進行分析時,隱藏的模式就會出現,可操作的見解也會出現。然后,DevOps工程師就可以分析出基礎設施需要調整的地方,以避免性能瓶頸的出現,并且可以坐在高管的桌前,為優化基礎設施和改進運營提供具體的基于數據的建議。
- 日常工作的自動化。識別出事件模式后,就可以設置自動觸發器。因此,當統計數據顯示某些事件總是導致特定的(負面的)結果,并且必須執行某些操作來糾正問題時,DevOps工程師就可以創建觸發器并自動對此類事件做出響應。
因此,如果監控解決方案報告了由于連接數量增加而導致了CPU使用率的增加,諸如此類。Kubernetes就可以啟動額外的應用程序實例,并使用負載平衡來分配訪問流和減少負載。這是最簡單的場景,而現實世界的用例則要復雜得多,需要允許自動執行任何的日常DevOps任務,使ML模型能夠在特定條件下啟動它,并預先處理問題,而不是在停機后。
使用AIOps的好處
部署AIOps解決方案可以實現以下的積極成果:
- 不間斷的產品可用性,帶來積極的終端用戶體驗
- 優先解決問題,而不是***性的滅火
- 消除數據孤島并實現根本性的故障修復,因為您分析了業務生成的所有數據而不是使用精簡樣本
- 日常任務的自動化,使您的IT部門能夠集中精力于改進基礎架構和流程,而不是處理重復且耗時的任務
- 更好的協作,因為對日志的深入分析有助于顯示管理決策的影響,并評估采用的業務戰略的效率
關于什么是AIOps以及為什么它很重要的最終想法
正如您所看到的,選擇AIOps工具和解決方案對您的業務非常有益。這似乎是AIOps解決方案供應商的營銷噱頭,但其實并不是。當下,大多數企業都在努力朝著DevOps文化轉型,并進行著數字化轉型。
與此同時,真正具有創新精神的公司已經在努力將人工智能算法、ML模型和DevOps系統相結合,以提供未來***進的云監控和基礎設施自動化解決方案。應用這些實踐可以極大地改善客戶體驗,縮短產品的上市時間,更有效地使用基礎設施,以及在團隊中更好地進行協作。然而,即使是這些創新者也沒有現成的解決方案來滿足他們的需求,他們不得不使用Splunk、sumeoric、Datadog、promethus + Grafana、Kubernetes和terra form等流行的DevOps工具來構建這樣的系統。更重要的是,盡管這個想法本身非常重要,但實施它所需的基礎設施管理水平遠遠超過了普通公司的能力。
原文標題:What Is AIOps: The Next Level of DevOps Services,作者:Vladimir Fedak
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】