2021年的3種IT監控趨勢
疫情的爆發,讓網站、云應用和云基礎設施的可靠性受到了成倍的考驗。世界各地的企業不得不在一夜之間進行自我改造,以支持分布式勞動力。從封鎖開始的一年后,具有前瞻性的企業正在再次重塑自己,因為他們準備支持混合工作場所,同時推進數字化轉型。
網站可靠性工程師(SRE)和DevOps團隊發現,自己在過去一年的遠程工作中承受著巨大的持續壓力,以幫助企業為客戶和員工在分布式地域的規模上保持最佳服務交付。同時,企業有必要變得更加敏捷,工程師有必要實施頻繁的軟件變更,以幫助企業保持高效和適應性。
DevOps團隊領導和SRE依靠數字體驗監控(DEM)來排除問題,改善團隊協作,并為最終用戶提供更好的體驗。我們已經確定了IT監控的三個趨勢,專門針對DevOps和SRE,以幫助減少這種繁重的日常工作負擔。
1. 混合工作場所的正常化將需要更多的全球支持,彈性的基礎設施。
情況是這樣的。從谷歌到思科,越來越多的公司正在重新定義未來的工作,包括混合工作場所。我并不期望所有的員工很快就會回到辦公室全職工作。相反,我相信企業辦公室將主要作為個人協作的場所,而家庭辦公室將成為日常工作的實際選擇。
由此帶來的挑戰:這種修改后的工作分配將要求本地網絡和基礎設施具有新的彈性。特別是,它將給不習慣高需求的城鎮和農村地區帶來額外的壓力,而城市工人最近已經搬到了這些地方。
IT團隊也將面臨持續的壓力,要為分布在家庭辦公室(互聯網連接可變且經常不穩定)和商業地點的員工提供可靠和一致的體驗。這不是一個容易維持的平衡。那么,企業如何才能實現這一目標呢?
解決方案。首先,IT團隊要有足夠的能力來管理這些多種環境。啟用混合工作場所需要詳細了解整個服務交付鏈的實時情況,包括最后一英里的情況。
為了實現這一目標,我們建議進行一次審計,以浮現任何跨越DevOps、NetOps和SecOps的監控孤島。然后,利用這些結果來識別和解決所有與性能、可靠性和安全性有關的潛在風險。通過了解和處理今天的問題,SRE可以努力實現明天真正靈活的工作環境。此外,他們可以在多個基礎設施上提供最佳的員工體驗。
2. 自動化程度越高,盲點就越大。
由新冠疫情引發了自動化技術在許多領域的不斷使用,例如迅速實現跨客戶體驗渠道的無接觸互動。同樣,大流行病也加速了SRE和DevOps團隊內重復性和常規任務的自動化。
我們聽說DevOps團隊和SRE越來越多地在應用管理的每個階段使用持續集成/持續部署(CI/CD)和基礎設施即代碼(IaC)。通過在整個開發/生產生命周期中引入自動化,工程師們看到,代碼可以更快地部署,以實現更快的上市時間。因此,隨著我們繼續進入2021年,我希望看到企業繼續加大對自動化的使用。
由此帶來的挑戰:隨著企業采用更大的自動化和更多的云原生方法,他們的應用程序和基礎設施環境變得更加復雜。自動化引入了更多的組件。同時,這些組件經常在極短的時間內運行。此外,每個組件都會產生自己的操作數據。構成這些分布式應用的服務之間的通信會進一步產生數據。
請注意:更大的復雜性和更大的數據量導致了更多的自動化盲點機會。
解決方案:尋求一種考慮到整個開發者和用戶體驗的監控方法。通過在應用程序生命周期中盡可能早地將任務轉移到左邊,我們一直看到,開發人員通過早期測試而受益。這意味著他們可以在缺陷變成大問題之前發現它們。一個提供全棧合成的監控解決方案將幫助DevOps團隊和SRE自信地向左轉移,提供對生產前環境和外部網站或應用程序上的代碼的用戶體驗的端到端可視性。
3. "就像豆莢里的兩顆豌豆:"可觀察性和監控將更多地串聯起來發揮。
我們看到,SREs正越來越多地將可觀察性和監控結合起來使用。隨著IT團隊意識到這兩個學科在更好地了解整個系統行為和健康方面的互補方式,他們也發現將這兩個學科結合起來使用有助于跟蹤有價值的SLO。
挑戰:SREs經常以一種孤立的方式使用可觀察性和監測數據。這導致了對用戶體驗的有限描述。隨著商業環境變得更加復雜,用戶體驗方面的差距也變得更加明顯。
解決方案:Observability允許運營部門從生產生命周期的任何階段的日志、指標、跟蹤和事件中提取數據。這擴大了從特定數據集中收集洞察力的能力(在大數據時代非常有用)。為了達到最大效果,企業將把可觀察性與數字體驗監測結合起來,以跟蹤其服務到達最終用戶所需的所有交付組件。
這些工具共同作用,極大地提高了SREs、ITOps和DevOps進行深度根源分析的能力,并在不消耗過多內部資源的情況下更快地解決性能問題。
通過了解和預測IT監控的這三個趨勢,DevOps和SREs可以更好地準備好有效地解決性能問題并改善業務成果。