CloudOps:優化云運維的新興框架
譯文譯者 | 李睿
審校 | 孫淑娟
希望升級云計算戰略的企業正在轉向CloudOps這一新興框架,以優化性能,并管理在云中開展業務的成本。
任何參與創建軟件產品的人都應該非常熟悉DevOps,這是一套結合軟件開發和IT運維的實踐,旨在縮短開發生命周期并提供持續交付和高質量的產品。
隨著企業越來越多地將應用程序開發和工作負載轉移到云中,并且這些云支出變得更加復雜,出現了一個相關的概念,即“云運維”(CloudOps)。
本文將研究CloudOps是什么,它如何使企業受益,以及在企業中實施CloudOps時應牢記的關鍵問題。
1.什么是CloudOps?
CloudOps是一種運營實踐,用于管理在云計算運營環境中運行的IT服務和工作負載的交付、優化和性能。
無論企業是采用多云、混合云還是私有云戰略,CloudOps都旨在為基于云計算的流程建立程序和最佳實踐,這與DevOps為應用程序開發和交付所做的方式非常相似。
2.CloudOps云運維的多層框架
咨詢機構凱捷美洲公司副總裁兼云卓越中心負責人Jason Hatch表示:“整體云運維是一個具有多個層次的框架,可以幫助企業管理其云生態系統的各個方面。”
其中一個是治理層,包括財務運營(也稱為FinOps)等活動,以控制成本和管理云預算。Hatch說,“治理層還應該包含關于如何以及在云中部署什么的架構標準,并有辦法以編程方式執行這些標準。”
其他框架層包括:云應用層,該層涵蓋了企業如何在云中部署和管理/監控應用程序和特定于應用程序的服務;云運維層,主要用于云計算服務的部署、管理、監控和運營;云基礎層,包括身份、網絡管理、日志記錄、中央備份管理、基礎設施即代碼和中央監控功能等核心服務。
Hatch說,“跨越所有這些層的是‘安全層’,其中包括漏洞和威脅管理、工作負載保護以及與企業更大的網絡安全管理功能的集成。”
3.CloudOps在企業中的應用
CloudOps模型與應用程序交付特別相關,許多企業都在關注旨在增加銷售額和增強客戶體驗的數字計劃。
云計算服務提供商Replicon負責工程和運營的執行副總裁Suresh Kuppahally說:“CloudOps將構建、部署、運營、監控和管理云中(Web)應用程序交付功能的五項首要職責結合在一起。”
Kuppahally指出,網絡、計算、安全和存儲是在初始構建和設計階段必須牢記的四個關鍵組件。他說,“從那里,企業或者自動部署他們的應用程序,或者通過持續集成和持續交付部署他們的應用程序。”
Kuppahally說,企業的CloudOps團隊還應明確區分職責和獨立于工程或產品團隊,這樣做使CloudOps能夠帶來企業內部的透明度和服務質量[QoS] 責任制。
4.CloudOps的好處
凱捷美洲公司的Hatch表示,CloudOps的商業利益是相當可觀的,首先是企業對云服務的整體部署。
他說,“CloudOps有助于推動企業內部進一步采用和使用云計算服務。如果企業能夠有效地部署、管理和保護他們的云環境,它應該增加他們對云計算的使用,并提供對新服務和技術進行試驗和創新的能力,這反過來又可以使他們更加敏捷,提供更快的上市時間,并有助于推動創新。”
Hatch補充說,利用CloudOps的企業還可以對他們使用的越來越多的云計算服務實現更好的管理和財務控制。
Hatch說,“我們不斷從客戶那里聽到他們超出了他們的云預算,他們或者不知道為什么,或者無法實施控制來管理它。有效的CloudOps有助于緩解這種情況。在治理層,我們可以實施更好的預算和財務跟蹤和優化。這在運維層也得到了促進,部署和管理方面的自動化程度更高。”
咨詢機構Protiviti公司的客戶引用的另一個最大好處是能夠在云中自動釋放授權資源,該公司總經理Will Thomas說,該公司幫助客戶管理云計算日益復雜的問題。
Thomas說,增強的安全性是CloudOps的另一個關鍵優勢,因為該模型確保與安全控制、標準或框架保持一致,并建立可以限制不合規行為的策略,同時報告云中的健康和活動。
Thomas還認為,實施CloudOps的企業能夠更好地優化其云環境,因為CloudOps工程師將專注于利用云中的授權資源,通過最新和最優質的服務實現應用程序的現代化。
此外,部署CloudOps的企業可以根據性能和成本考慮制定適當的資源分配時間表;持續報告和審查有關云健康狀況的指標;支持主動配置資源,同時保持云中的合規性。
Replicon公司的Kuppahally指出,CloudOps能夠在不影響QoS的情況下經濟有效地擴展云服務。他說,“使QoS目標和CloudOps投資保持一致是非常具有戰略意義的,因為可以激勵專門的CloudOps團隊來管理運營成本,因此將在降低運營成本方面獲得既得利益。”
5.CloudOps的實踐
Stretto公司是一家受益于采用CloudOps的公司。該公司首席技術官George Tsounis說,這家服務于企業和消費者破產部門的破產服務和技術公司很早就確定了對CloudOps實踐的需求,并將關鍵原則納入其在云中運行的應用程序和系統中。
Tsounis說,“例如,我們制定了嚴格、快速的規則,我們只會將基礎設施即代碼[IaC]實踐用于任何部署。我們通過決定所有的應用程序/系統將始終跨兩個可用性區域運行來實現冗余,因此我們利用了云計算提供商的內置高可用性功能。”
Tsounis表示,Stretto公司戰略的關鍵部分是利用CloudOps實踐來確保對其技術運營采取更積極主動的方法。他說,“我們更愿意授權我們的架構師和工程師為我們的內部和外部客戶創建高性能、自我修復和彈性的云原生解決方案,而不是繼續以被動的方式運營。”
Tsounis表示,云服務的引入甚至是向無服務器功能過渡的過程,都帶來了獨特的挑戰。他說,“CloudOps是幫助我們應對這些挑戰的戰略。”
CloudOps最終為Stretto公司帶來的好處包括降低成本、可擴展性、自動化、簡化的災難恢復以及隨著基礎設施成為應用程序的一部分而無縫集成。
Tsounis說:“我們的團隊受益于應用程序的全面改進,這些CloudOps理念已被采用。CloudOps實踐也提高了質量。這可以通過利用基礎設施即代碼方法使云計算基礎設施的部署和配置可重復來實現。隨著我們在各種環境中推出應用程序,減少了配置錯誤,現在利用基礎設施即代碼擁有一致的基礎設施配置。”
Tsounis表示,Stretto公司通過取消對其云計算基礎設施的人工配置,質量問題減少了大約20%。
他說,“利用CloupOps實踐為工程師提供了他們需要知道的應用程序/系統行為在預生產環境中發布到生產環境時的成功信心。此外,由于我們的應用程序質量改進,服務臺和內部票證減少,我們看到了整體IT運營的改進。”
6.跟上不斷發展的方法
在云服務及其使用方式方面,沒有什么是一成不變的,因此采用CloudOps的企業需要定期調整他們的方法以跟上變化。
對于許多企業來說,這仍然是一個需要克服學習曲線的新領域。凱捷美洲公司的Hatch 說,“隨著越來越多的企業采用真正的多云部署,他們的CloudOps實施也需要成熟和擴展。許多客戶在孤島中管理他們的云環境,使用不同的工具和流程管理每個云計算環境,而從整體上查看整個云環境。
為了更加高效和有效,企業需要開發他們的CloudOps框架,以便能夠輕松插入新的云提供商和服務,同時仍然提供適當級別的管理、監控和運營嚴謹性。”
Kuppahally表示,企業在云中處理事件管理的方式也可以得以改進。
他說,“這是大多數CloudOps團隊都在陷于困境的領域,他們充斥著內部和外部事件,并且無法有效管理它們。擁有專門的項目管理流程來簡化事件管理分類和優先級排序是降低風險的方法之一。
與此同時,企業需要降低事件誤報率。當CloudOps團隊無法跟上高誤報率時,他們就會不堪重負。制定有效的策略和計劃來減少或消除誤報是非常關鍵的成功因素。”
研究和教育服務提供商Wiley公司的執行副總裁兼首席技術官Aref Matin表示,CloudOps可以從人工智能(AI)和機器學習等技術中受益。
Matin說,“通過機器學習,CloudOps工具可以幫助定義企業范圍的策略,檢測和報告異常情況,并以自動化的方式采取糾正措施,以維護云計算最佳實踐策略。”
7.CloudOps文化
與DevOps一樣,CloudOps的成功很大程度上取決于培養一種旨在充分利用框架和工具的文化。隨著越來越多的企業將更多的工作和流程轉移到云端,他們需要專注于構建CloudOps專業知識。
Protiviti公司的Thomas說,“大多數客戶在處理云計算服務時處于反應狀態,無法響應事件、更改或對新服務的請求。CloudOps通過自動化啟用的部署建立了結構,允許監控、審查和優化現有資源,并檢查企業政策以與云計算保持一致。”
Stretto公司的Tsounis對此表示認同。他指出 ,企業需要更廣泛地了解適當的組織結構、專業知識和協作的適當協調,CloudOps才能真正發揮作用。
Tsounis說,“CloudOps不是一個單獨的團隊或部門。IT、安全、架構和應用程序團隊需要協作并在常見的CloudOps實踐上保持一致。如果這些團隊在孤島中工作,CloudOps就不能很好地工作。”
根據將CloudOps付諸實踐的經驗,Tsounis認為,企業還需要更好地定義CloudOps所需的基本技能才能取得成功,而不是重新發明輪子。
他說,“技術團隊需要了解基于云的架構、網絡、安全和自動化。如果沒有基礎技能,團隊可能會冒險在已經存在云服務的情況下實施解決方案。”
原文鏈接:https://www.cio.com/article/100000992/cloudops-a-framework-for-optimizing-your-cloud-operations.html