AIOps 如何簡化智能建筑監控與管理?
在復雜的現代 IT 環境中,AIOps 利用人工智能簡化 IT 運營管理并加速和自動完成問題解決過程。
智能建筑技術很棒——只要它們運行正常。
隨著建筑業主繼續涉足在商業建筑和校園中部署的各種物聯網系統,如果從性能和網絡安全的角度處理不當,管理每個系統的硬件和軟件將成為一項艱巨的任務。
幸運的是,利用人工智能 (AI) 的先進監控平臺正在市場上廣泛使用。它們被稱為 人工智能IT 運營 (AIOps) 平臺的——它們可能是滿足您的智能建筑監控和管理需求的確切解決方案。
什么是 AIOps?
AIOps(即人工智能 IT 運營)是應用人工智能 (AI) 來改進 IT 運營的方法。 具體而言,AIOps 使用大數據、分析和機器學習功能來執行以下操作:
- 收集并匯總由多個 IT 基礎架構組件、應用程序和性能監視工具生成的、不斷增加的海量運營數據
- 智能地從“噪聲”中篩選出“信號”,以識別與系統性能和可用性問題相關的重要事件和模式。
- 診斷根本原因并將其報告給 IT 部門以便他們快速響應和補救,或在某些情況下自動解決這些問題而無需人工干涉。
通過將多個單獨的手動 IT 運營工具替換為單一的智能自動化 IT 運營平臺,AIOps 使 IT 運營團隊能夠更快地作出響應,甚至主動處理慢速和中斷事件,從而大幅減少工作量。
它可以縮小下面兩大對立面之間的差距:一方面是日益多樣化、動態且難以監控的 IT 環境,另一方面是用戶對應用程序性能和可用性幾乎或根本無中斷的期望。 大多數專家都認為 AIOps 是 IT 運營管理的未來。
什么是 AIOps 平臺?
基礎設施監控和管理工具已經存在了幾十年。示例包括使用 ICMP 和 SNMP 協議的簡單測試工具,一直到執行深度數據包檢測 (DPI) 和對通過線路的每個數據包進行流式網絡遙測的高級系統。
雖然所有這些監控協議、工具和平臺都提供了監控可見性,但大多數都是獨立部署的,不提供自動化分析,也不在彼此之間共享關鍵數據。 AIOps 平臺將許多這些不同的技術整合到一個集中管理的統一工具中。
AIOps 背后的概念是收集大量相關的基于網絡的監控和健康信息。如此之多,以至于人類管理員會發現管理起來很困難,如果不是不可能的話。然而,在人工智能的幫助下,數據分析過程可以自動執行,并向操作管理員顯示警報和補救步驟,而所需的人工干預相對較少。
AIOps 平臺如何獲得智能?
為了獲得識別性能和/或網絡安全問題所需的必要情報,新實施的 AIOps 系統必須首先位于網絡上并觀察被認為是“正常”的網絡行為。一旦完成,管理員可以設置各種性能和安全相關指標的監控閾值,當網絡行為超出這些設置的限制時,管理員會反過來提醒他們。
由于 AIOps 平臺正在攝取和分析整個網絡的網絡健康信息,因此 AI 通常可以實時確定導致問題的設備以及原因。這顯著減少了故障排除時間以及管理員修復性能或網絡安全事件的速度。
AIOps 如何從智能建筑監控和管理的角度幫助我們?
最好將 AIOps 平臺視為 IT 運營團隊基于 AI 的擴展。鑒于這種情況,AIOps 平臺可以自動化許多以前由員工手動執行的流程。這包括:
- 收集整個建筑物或校園網絡的網絡性能、健康和安全數據。
- 從性能和網絡安全的角度對收集的數據進行智能分析。
- 在發現性能/安全問題時提供自動警報。
- 提供網絡和連接設備整體健康狀況的集中式端到端視圖。
對于尋求將智能建筑技術集成到其物業中的建筑業主和運營商——但他們也希望在“精益 IT 模式”下工作以限制管理智能建筑技術所需的 IT 人員數量,AIOps 提供了以下好處:
- 自動識別 IT 性能或網絡安全問題。
- AI 支持的根本原因分析和修復。
- 額外的網絡安全監控層,用于識別受感染設備何時開始與命令和控制服務器通信,偏離“正常”網絡行為。
AIOps 平臺有什么缺點嗎?
AIOps 平臺的一個顯著缺點在于,監控和警報工具必須首先觀察基礎設施在現有條件下運行時的情況。此步驟用于確定被認為是最佳網絡行為的基線。
如果您網絡上的設備或服務已經導致性能或網絡安全問題,則基線步驟可能具有挑戰性。如果在基線過程之前問題沒有得到解決,AIOps 平臺會將它們構建到基線指標中,并將它們視為典型行為。
此基線要求意味著必須花費時間和精力提前手動解決盡可能多的性能和安全相關問題,以便 AIOps 工具建立盡可能接近最佳的監控基線。
因此,對于那些正在研究 AIOps 以簡化其基礎設施監控和管理的人,最好的建議是首先讓所有現有技術盡可能地運行。一旦該步驟完成,持續的 AIOps 監控和警報將更加準確。