云計算應用程序監控需要采用多管齊下的方法
企業如果希望監控云應用,需要收集有關性能、成本和安全性的指標。企業IT團隊及其選擇實施的工具需要協調工作。
云計算應用程序監控是一項多學科的工作。為了優化基礎設施,管理人員和開發人員必須實施幾種不同類型的云應用程序監控措施,其中包括檢查性能、開銷和安全性。更重要的是,其中一些監控學科包含子學科。
為了使問題更加復雜,需要以特定的方式監控不同類型的云計算應用程序或服務。例如,監視無服務器功能需要一種不同于監視虛擬服務器上運行的應用程序的方法。
為了制定一個云計算應用程序監控策略,需要探討主要的監控類型,它們如何應用于各種類型的應用程序和云計算服務,以及哪些本地工具和第三方工具可用。
云計算監控的關鍵類型
云計算監控可以分為三個重要但重疊的類別:
- 性能監控。這種類型的監控旨在確保云計算應用程序可用,并且它們可以充分運行。其目的是識別和診斷可能削弱性能的各種類型的問題,范圍從基礎設施問題(例如缺乏網絡帶寬)到配置問題(例如無效的負載平衡設置)到應用程序錯誤。
- 成本監控。在云中,資源的低效使用會迅速產生大量成本,因此監控成本尤為關鍵。因此,云計算成本監控已成為其自身的一門學科,其中包含各種專用于成本優化的工具和策略。
- 安全監控。安全監控在任何情況下都很重要,但在云中執行可能尤其具有挑戰性。這不僅是因為云計算環境通常由多個重疊的基礎設施和軟件層組成,而且因為云計算在公共和專用網絡之間沒有提供硬邊界。
這些類別的云計算監控以各種方式重疊。例如,安全監控包括識別分布式拒絕服務(DDoS)攻擊,這也會威脅到應用程序的可用性和性能。它們還涵蓋了優化云計算應用程序性能、成本和安全性所必需的其他幾種類型的監視,例如數據庫監視和日志監視。因此,云計算監控的類型應該被視為云計算應用程序監控的重疊學科,而不是整齊明確的監控類型。
同樣,值得注意的是,盡管上述三種監控類型的主要責任通常都落在不同類型的IT員工身上,但最好的云計算監控策略使所有類型的監控都成為一項集體努力。例如,安全監控可能是安全專業人員的主要職責,但其他IT管理員和開發人員也需要參與幫助識別和響應安全問題,以便快速解決這些問題。
同樣,成本監控應該是IT組織內每個人的關注點,因為以任何方式監控云計算的任何人都可以幫助識別和解決云中的浪費或效率低下的流程。
構建云計算監控策略
在許多情況下,本地工具不足以進行適當的云計算應用程序監控。
要執行每種類型的監視,IT團隊應審查特定的指標和信息。這不是一個全面的列表,但它提供了一些團隊應該尋找的真實示例。
重要的是,這些指標還強調了監控策略根據團隊部署的特定云計算工作負載而變化的方式。例如,當運行基于云的虛擬機時,企業需要查找的信息類型與監視無服務器應用程序所需的信息類型非常不同。
各種指標和信息來源有助于績效監控,其中包括以下內容:
- 資源可用性。企業部署并運行的云服務或實例是什么?如果虛擬機意外關閉,或者數據庫不再響應請求,這些可能表明云計算應用程序性能問題迫在眉睫。
- 響應時間。云計算資源響應請求需要多長時間?響應緩慢可能是因為資源本身缺乏快速響應的計算能力或內存,或者網絡帶寬不足可能是根本問題。
- 應用程序錯誤。企業的云應用程序產生了多少錯誤?這些錯誤的根源是什么?根據運行的應用程序類型以及這些應用程序記錄錯誤的方式,跟蹤此信息的能力會有所不同。例如,無服務器功能生成的日志數據相對較少,而在虛擬機中運行的傳統Web應用程序將生成更多的日志數據。如果企業使用的云計算服務提供對錯誤信息的訪問,那么操作系統日志也是錯誤信息的重要來源。
- 流量水平。在給定時間內有多少用戶訪問企業的云計算服務或應用程序,流量模式隨時間的變化如何?如果流量突然激增,企業是否準備擴大云計算資源分配以滿足需求?
要跟蹤和優化云計算成本,請查找未使用的資源。正在運行但未被主動使用的虛擬機實例,云計算數據庫和其他資源是云中成本效率低下的常見來源。企業確定并關閉這些資源,團隊還可以考慮將工作負載遷移到不同類型的體系結構,例如無服務器,這要求企業僅在服務處于活動狀態時才付費。
另一個需要關注的領域是虛擬服務實例優化。大多數云計算提供商允許用戶從數十種虛擬機實例類型中進行選擇。當企業能夠確定哪一個對于給定工作負載而言最具成本效益時,將不太可能超支。此外,用戶應盡可能利用折扣實例產品(如保留實例)。
當然,安全性是云計算應用程序監控中的一個重要考慮因素。團隊為支持云計算安全而收集的信息類型將根據他們部署的工作負載及其面臨的威脅而有很大差異。但總的來說,大多數云計算安全監控策略都將重點關注以下方面:
- 身份和訪問管理。必須正確配置身份和訪問管理(IAM)策略,以防止對云計算資源和服務的意外訪問。如果企業使用它們,容器將需要以最大限度地隔離它們和主機的方式進行配置。例如,確保阻止容器以root身份運行。
- 漏洞檢測。部署在云中的代碼——無論是在虛擬機、容器、無服務器功能還是其他方面,查看是否正確掃描了已知的惡意軟件簽名?
- 運行時異常檢測。應監控在云中運行的應用程序和服務是否存在異常行為,這可能表示存在違規行為或企圖違規行為。
- DDoS攻擊。 DDoS攻擊通過向云計算應用程序發送大量請求而使云計算應用程序崩潰,對云計算安全和性能都構成威脅。IT團隊應使用云計算提供商的工具(如AWS Shield)來緩解DDoS攻擊,同時還應監控表明正在嘗試此類攻擊的網絡流量模式。
云計算應用程序監控工具
在云計算提供商提供的本機監控工具(如Azure Monitor和AWS CloudWatch)和第三方監控產品之間,可以輕松構建云計算監控工具集。
大多數組織將使用其云計算提供商或提供商的本機工具作為執行所有類型的云計算監控的基礎。但是,在許多情況下,本機工具還不夠。添加第三方監控平臺是明智之舉,該平臺可以獲取CloudWatch等工具收集的數據,并幫助團隊更有效地分析和可視化。許多這些第三方工具包括應用程序性能監視(APM)平臺。有些具有安全信息和事件管理(SIEM)平臺,可以分析來自云端的數據以發現安全事件。
有效的云計算應用程序監控是一項復雜的工作,需要企業從多個角度進行監控。整個IT團隊需要做出貢獻,部署各種工具和策略來收集指標,從而全面了解云計算應用程序的性能、成本效益、安全性。