企業多云管理:在技術、人員、流程方面面臨的挑戰
雖然云計算已經以某種形式出現了十多年,但從私有、本地或公共位置管理其當前企業迭代的工具仍在快速發展。Gartner 表示,包括 IBM/Red Hat、VMware、CloudBolt、Flexera、Scalr、Cisco 和 Nutanix 在內的 90 多家供應商提供不同程度的云管理功能。
VMware 云管理業務部產品營銷副總裁 Roy Ritthaler 表示,雖然有很多選擇,但企業很難有效地管理多云環境。
Ritthaler 表示,“由于工作負載部署在多個公共云、多云 Kubernetes、私有云/數據中心和邊緣位置,大多數企業發現很難統一了解其環境的健康狀況以及管理成本、確保安全性和改善運營治理,同時實現核心流程自動化?!?/p>
這不僅是技術挑戰,也是人員和流程的挑戰。缺乏統一的供應工具、孤立的運營可見性、缺乏整體性能和成本洞察力以及互操作性和集成問題意味著孤立的資源、分散的團隊和管理工具的擴散。涉及多個角色——IT 運營、DevOps/開發人員、財務和業務線 (LOB) 領導者——在企業采用云模型時需要廣泛的培訓、協作和流程變更。
IDC 研究發現,大多數企業預計他們將需要全新的多云管理工具來滿足他們新興的業務和基礎設施運營需求。
“隨著開發人員和業務組實施最符合其應用程序和業務創新路線圖的云服務和工具,而對企業偏好的考慮有限,多云架構正在引入新一波的管理復雜性。容器、微服務和 Kubernetes 的引入進一步增加了復雜性。” IDC 表示。
據 IDC 稱,未來兩年,企業決策者預計將優先投資于分析、性能監控和報告、容量優化、成本管理以及自動化和自助服務,以增強多云和治理的管理能力。
這些管理工具緊密相連。成本決策必須根據容量需求和應用程序性能進行決策。
企業也對跨越不同云提供商的應用程序開發密度感到焦慮。
企業管理協會(Enterprise Management Associates)的一項研究表明,有 2316 個與 AWS、Azure 和 Google Cloud 相關的 Python 庫,開發人員每天下載大約 1300 萬次到 112 個不同的(主要是基于 Linux 的)操作系統。
“雖然單個項目通常位于單個云的邊界內,但 EMA 也看到越來越多(約 10%)的項目跨越多個云。微服務的快速增長加劇了這一趨勢,同時強調了開發人員和 IT 運營商迫切需要統一的治理和管理層,以同時為優化發布效率和運營可靠性做出貢獻,”EMA 表示。
如此廣泛的項目導致許多客戶尋求幫助來管理跨多個環境的工作負載,這需要多個控制臺和工具。
隨著企業管理多云環境以及控制臺和工具數量的增長,遇到來自孤立數據的挑戰是很常見的,這是將運行在遺留系統上的應用程序遷移到不同的云環境中不可避免的常見副作用。
根據IBM的研究,隨著企業將斷開連接的數據從一個云遷移到另一個云以供各種應用程序使用,他們經常會遇到性能問題,并且成本會顯著增加,甚至高達 300%。
部分用戶也會抱怨多云服務,稱由于云之間的數據傳輸和 IT 人員增加,使他們的成本大幅增加。
1. 在云之間獲得統一的視圖
隨著企業遷移到多個云,他們很快發現每個云提供商都是獨一無二的,這增加了管理這些環境的挑戰,例如網絡架構、功能和規模,這為客戶在云中操作和給數據中心和校園網絡等現有環境帶來了運營挑戰。
以 Arista 為例,該公司提供 CloudEOS 和 CloudVision 軟件,這些軟件支持私有云或公共云之間的網絡連接和管理功能。
借助 CloudEOS,客戶可以使用針對所有網絡抽象的一致操作模型來操作多個公共云——使用它們用來操作現有數據中心和園區網絡的相同運行手冊和流程?!癈loudEOS 遙測技術與 CloudVision 相結合,可提供給客戶多云網絡網絡狀態的時間序列存儲和分析,這讓客戶可以回過頭來檢查問題發生的原因和方式,并減少恢復運營的時間,同時對初始故障檢測進行快速的根本原因分析?!?/p>
在成本方面,單獨的 Arista 產品 - CloudEOS Edge - 支持網絡邊緣的動態路徑選擇,允許客戶為應用程序分配路徑以降低數據傳輸/同步成本。通過跨數據中心、園區和多個公共云的統一 EOS 和 CloudVision 部署,客戶可以支持和管理他們的多云戰略,而不會將他們的團隊規模擴大太多或影響他們的預算計劃。
2. 故障排除
在管理多云環境時,企業面臨的另一個問題是區分應用程序性能問題和網絡問題。
企業往往很難準確預測新配置的云服務對網絡的影響。
其實,IT 和 DevOps 團隊可以一起工作,使用共享詞匯來查明應用程序退化的根本原因,主動實時預防問題,設置策略,并自動響應以解決本地或云中的應用程序問題。
由于缺乏信息和可見性,大多數企業發現在公共云中排除網絡問題非常困難,尤其是在故障排除需要數據包級別的可觀察性時,應用程序和網絡 IT 人員一起工作,使多云工作更有效,但目前大多數企業還沒有做到這一點。
3. 來自 AI/ML 的幫助
將來自物理本地部署和多個云的數據拼接在一起并對其應用分析是一項挑戰,但這是管理這種環境的關鍵。
部分提供機器學習和人工智能驅動的云管理平臺,可以簡化網絡基礎設施設備的入職、配置、監控、管理、故障排除、報警和報告。
在多云環境中,在本地和跨多個云環境中同樣運行良好的解決方案是獲得全面可見性和消除孤島的關鍵。部分解決方案測量應用程序的可用性和性能,自動化操作以快速從應用程序或網絡性能問題中恢復,并提供可見性和工具來診斷和修復問題,以免影響運營或最終用戶對應用程序環境的體驗。
當然,管理多云世界還面臨其他挑戰。
企業需要使員工具備管理多供應商產品的技能。數據格式和 API 是不同的,企業需要一個能夠理解所有這些事情的團隊。
IDC 表示,容器、微服務和 Kubernetes 的引入進一步增加了復雜性。
從多云管理組合中獲得收益需要企業做出權衡和戰略投資選擇。在快速發展的技術環境中,很難完全預測新流程、方法和工具的影響。