企業云成本優化應以提升云資源效益為宗旨
近年來,低碳發展已上升為我國的國家戰略,2022年黨的二十大報告中再次強調了碳達峰、碳中和的重要性,各領域需持續拓展低能耗綠色發展之路。云計算作為促進能源效率提升和結構優化的關鍵技術,幫助企業實現“減排不減產、增收不增耗”的可持續發展目標,在企業“雙碳”節能工作中起到重要作用。
作為IT資源的新型服務形式,云計算正加速成為各行業企業數字化轉型與低碳發展的新引擎,不僅提高計算、存儲、網絡等資源利用率以及社會整體的算力利用率,而且大幅度降低二氧化碳排放量,推動社會資源效能全面提升,為傳統企業軟件架構變革、管理模式創新、業務生產增效帶來新動力,加速企業業務數字化發展。
隨著企業上云廣度、深度持續拓展,業務云計算的成本投入與用云復雜程度不斷增加,成本過高、效益不及預期等問題開始顯現。如何節省上云和用云成本、提高使用效益,成為當前企業關注重點,企業工作中心逐漸從如何遷移上云轉變為如何優化用云。
云資源浪費普遍存在,云成本優化成為必然
云計算使企業IT消費模型產生巨大變化,原有的成本管控模式不再適用于云計算環境,各類業務陸續上云導致企業成本管理難度不斷提高,云資源浪費愈發嚴重。企業如何應對日益復雜的云環境,提升自身成本優化能力成為關鍵課題。
企業用云效果不佳,云計算價值釋放不足
近年來,企業選擇成本更低、更綠色的云計算代替傳統IT基礎設備,讓生產效率、運維效率、能源效率最大化。雖然企業云計算采用率不斷攀升,但是高采用率并沒有對應高成功率,云計算使用成本和復雜程度均超出企業預期。企業上云用云成本過高、價值釋放不足、管控難度大等問題日益顯現。《中國云使用優化報告》數據顯示,企業上云后成本不可控制是企業用云面臨的最大挑戰,且九成以上用云企業面臨成本浪費問題。過高的成本導致云資源投入與產出收益不匹配,其中較為典型的是以工業為代表的傳統行業。麥肯錫調查數據顯示,74%的企業云轉型未能獲取預期價值,受訪者認為,云技術比他們最初預期的更復雜。40%的受訪者認為云資源成本超出了企業的預算,而云轉型所帶來的IT價值與預期價值卻存在較大差距。
資源效益備受關注,成本優化進入新階段
Flexera 《2023 年云現狀調查報告》顯示,云成本的管理取代了安全性話題,成為當下云使用者面臨的首要問題。82% 的受訪者面臨的首個挑戰是管理云計算支出,其中有71%的重度云用戶將優先考慮優化云的現有使用情況(節省成本),79%的受訪者要解決安全性問題,上云用云企業仍然面臨平均約30%的成本浪費。面對遠超預期的成本浪費;過去企業對于成本優化的需求主要集中在如何降低云計算成本開支與減少成本浪費。然而隨著企業對于云計算的理解不斷深入,他們逐漸意識到,應關注使用云資源后能為業務帶來多少效益,而非單純節省成本。
云資源效益是衡量企業上云用云成效的關鍵因素,即企業使用各種云資源為業務發展所帶來的貢獻度,或云資源投入與收益比。在企業用云過程中,云資源為上層業務提供支撐,云資源的使用與運營關乎著云平臺整體效能水平以及云業務的敏捷性、創新性和安全性等。優化提升云資源效益,可以使云資源為業務提供更加優質的支持,是企業云計算價值充分釋放的重要標志。企業成本優化也隨之進入新階段,從一味地追求降低業務云計算成本,轉為在成本可控的保障下全方位提升云資源效益。
云改變企業IT成本模型,組織建設是云成本優化的關鍵保障
云計算重塑企業 IT 消費模型。云成本與傳統 IT 固定成本不同,企業 IT 基礎設施采購方式從原來的集中式重塑為分布式,且采購決策模式從原來的短期決策重塑為長期運營。企業 IT 成本管理由原來的前置評估重塑為后置監控,且成本類型由原來的固定成本CapEX重塑為“CapEX+OpEX”可變成本,這些變化需要企業優化調整組織結構以應對云成本的管控。一方面,企業需要建立云成本優化的長效運營機制,從原來的采購階段延伸至戰略、采購、上云、用云、持續運營等階段,并循序漸進形成閉環;另一方面,云成本管理也從原先的IT預算制變為運營制。相應的,企業需要從人員組織、工具平臺、流程制度等方面建立可持續的云成本優化體系。
企業云成本優化能力建設應貫穿用云全周期
成本優化貫穿業務上云用云全周期,各階段采取對應策略實現閉環優化。從企業上云用云歷程看,大致可以劃分為戰略、采購、上云、用云、持續運營等階段。圍繞成本問題,每個階段的工作關注點不同,在各階段實施對應的技術和管理手段能夠幫助企業實現成本優化管理。戰略階段是決策云部署及技術選型的關鍵期,選擇不同的云計算模式意味著不同的云成本構成,架構的選型也會很大程度影響成本優化管理方式方法。采購階段解決如何采購云資源。云資源類型和計費方式種類繁多,根據業務特性選擇合適的資源和付費方式,避免成本浪費是成本優化最直接的手段。上云階段結合業務實際情況規劃云上IT治理結構,提前設計并建設權限、審計、成本等方面管理體系,全面制定成本優化治理模型。用云階段對云資源進行全面監控管理,對閑置、低效率情況進行及時處理,采取針對性優化措施。持續運行階段建設成本長效運作機制,對各環節成本優化工作進行復盤,定期匯總分析歷史數據,形成更加有效的優化策略并應用于各環節中,進行持續閉環的成本優化。
企業云成本優化能力建設須協同人員、工具和流程
企業需要從人員角色、工具平臺、流程制度3方面建立可持續的云成本優化體系。
人員角色是云成本優化工作的關鍵抓手,成本優化需要企業業務、財務、技術等方面多個角色共同參與,打破原有“各管一段、各自為戰”的傳統IT管理方式,形成FinOps成本優化團隊,各角色長期協同共同努力達到成本長期治理的目標。工具平臺是云成本優化工作的重要手段,成本優化是個復雜且耗時的工作,例如賬單的拆分、計費的管理,僅靠人工是無法使成本優化工作效率提升至較高水平的,需要將各項能力沉淀到工具中。流程機制是云成本優化工作的前提保障,面對云計算特殊的消費模式和運營模式,成本優化工作需要組織內部與流程機制進行對應。權限管控體系、資源申請流程、獎罰機制等優化流程機制能夠確保在閉環環境下,優化策略可以在企業內部精確、高效運轉。
云改變企業IT運行模式,資源提效是云成本優化的核心
當前,企業對自身云資源使用情況不夠了解,相關人員通常關注云資源采購較多,對于上云后的如何用云、資源運營情況關注程度較低,造成資源使用效率低下、資源閑置、資源低效率運行,甚至大量計費資源未使用等現象普遍。在此背景下,提升云資源效益尤為重要,企業可從資源的規劃、監控和使用3方面優化云資源,并通過云資源效益度量了解自身效益情況。
合理規劃資源容量,配置彈性資源補給
根據業務特性選擇合適的付費方式是成本優化最直接的方式。從付費層面來看,按照業務場景長期使用的穩定業務資源需求,通過選擇成本較低的包年包月等方式來支撐負載。可以先使用低配置資源,觀察評估運行資源負載后再升級配置,還可以將使用率低的資源降低配置或釋放。如果業務有使用周期且有不同狀態下的資源需求可以選擇成本相對較高但使用時長更靈活的按量付費方式,如臨時測試、彈性伸縮選擇按量付費資源。按量付費資源采用停機不收費的模式,以保留數據并能快速啟用。如需長期運行,可以更換預付費模式。可容錯的業務可以通過成本非常低廉的“搶占式”來支撐。
此外,付費方式并不是一成不變的,企業應根據業務資源歷史運行數據,及時調整資源類型。例如,針對CPU利用率一直較高的后付費類(按量計費)云服務器,如果其連續兩個月使用時長產生的費用超過同規格預付費類(包年包月計費)費用,可以將計費模式更改為預付費。
企業可以通過組合使用多種類型資源節省成本。針對云成本的管理與優化,企業需要關注實例的收費模式。其中,云服務商實例定價模式通常有以下3種。
(1)按需:隨用隨啟,根據運行的實例以按小時或按秒的方式計算容量并付費。
(2)預留:有一定的使用承諾(如1年或3年的使用承諾),與按需實例的定價相比,預留實例可提供大幅折扣(通常為按需實例的60%)。
(3)競價:提供極端彈性和廉價的計算資源。其價格根據供需關系而變化,與按量付費實例的相比具有非常明顯的價格優勢(通常為按需實例的10%~20%)。
根據業務特性采用資源組合方式是重要的成本優化方式,組合付費是指企業利用云端彈性的優勢配置自動伸縮功能,以實現按需購買實例和預留實例的組合使用,以應對業務變化引起的資源需求變化,從而獲得最佳的成本效益。
構建資源監控體系,有效識別低效資源
在實際運行中,生產系統的底層資源運行情況才是資源利用率的真實反映。通過構建云資源監控體系,持續監控系統與資源對應的各項指標。一方面,需要監控各類云資源的使用情況,如監控云主機CPU使用率、內存使用率等指標,通過時間等維度配置策略。另一方面,需要有效劃分閑置資源、低負載資源,如某類云主機從創建后,一直處于關機狀態,此類云主機可判定為閑置資源,運維管理員可將云主機進行回收,釋放對應的CPU、內存等資源,避免云資源浪費。
根據監控數據分析出存在優化空間的資源單元。根據持續周期的監控數據,平臺可以評估可優化的費用空間,同時對于存在忙時及閑時流量特性的場景,可靈活組合多種計費方式資源以節省成本。例如,監控各業務使用云資源配額的情況,若出現配額閑置,管理員應當減少該租戶部門的容量配額,將配額優先分配給處于瓶頸的業務,減少云平臺配額的浪費。此外,在監控的基礎上,企業可分析以往數據,有效預測云平臺容量未來變化,提前預警提醒企業運維人員。
閑時資源自動縮容,閑置資源合理關停
負載訪問有明顯的周期規律類業務,閑時可以進行資源降配。很多業務的流量具備周期性規律,若是使用常備服務器支撐日常峰值流量,在非峰值時段服務器的利用率顯然是不足的。對于此類業務,可以根據業務的實際流量定時擴縮容,以此大幅降低云上成本。
業務訪問有明顯閑時周期的業務通常可分為4類,一是開發、測試類系統,這類系統所用的按量付費資源,非工作時間自動啟停。二是社交類業務系統,如微博、抖音等峰值流量出現在中午1點和晚上10點左右,可能達到日常流量的1.5倍甚至更多,可設置閾值自動調配資源。三是證券類業務系統,工作時間內有穩定的訪問需求,工作時間外(例如晚間或者節假日)可對資源進行適度降配。四是運行在企業內部的軟件系統,例如企業級套裝軟件ERP、客戶關系管理系統CRM等,辦公類系統節假日可以適度降低資源配置。
企業在云上的閑置資源關停通常有兩種情況,一是過剩資源關停,當大部分資源的使用率或配額低于原本規劃的范圍,且合理使用時被定義為預留過剩,應降低預算配額,合理優化成本。二是遺留資源關停,通常是依賴關系不存在時的遺留資源,例如快照資源,依賴于其他資源生成數據,當其他資源不存在時,快照也無需存在,針對該類資源建議及時停止或刪除。
企業云成本優化能力建設指導標準體系
標準規范和評價體系讓企業云能力建設“有規可依”
當前企業云成本優化能力體系建設正處于初級階段,尚無大規模落地經驗,企業缺少相關環節的標準規范引領。企業云成本優化能力體系建設以及云成本優化相關的標準、成效評價體系成為新的關注方向。當前,中國信通院已經形成了覆蓋云成本優化能力建設、云資源效益水平度量等全方位、多角度的標準和評估模型,并將持續研究企業云能力優化課題,完善企業在云成本、性能、安全、數據等領域的優化和治理標準體系,面向央國企等場景展開深入研究,形成多維度、完整的評估體系。
云成本優化能力建設標準規范和評價體系
云成本優化能力建設標準規范助力企業構建高質量、高效率的成本優化體系,標準既涵蓋企業云成本優化領域能力建設、工具水平、服務質量,同時還提出企業事后云資源效益情況度量的一套方法,為企業云成本優化前期規劃、中期執行、后期復盤全流程提供專業指導。
在能力建設方面,中國信息通信研究院研究發布了成本優化服務商、優化工具、成本優化能力成熟度等領域多項標準。成本優化服務商標準包括考察服務方成本優化咨詢能力、工具服務能力、實施能力、培訓賦能能力4方面,對服務方成本優化流程和質量進行規范性要求。成本優化工具標準針對原生成本優化工具和混合多云成本優化工具提出了場景化的能力要求,為企業選擇成本優化工具提供重要依據。成本優化能力成熟度標準考察企業自身成本優化能力是否完備,從技術、流程、組織維度評價企業成本優化能力成熟度,引導企業正確規劃未來成本優化建設方案。
在評價體系方面,中國信息通信研究院提出了企業云資源效益度量模型(Cloud CAPEX Efficiency Model ),依據《企業云資源效益度量模型》幫助企業分層次、分模塊地評估衡量云計算使用成效,評估價值結果分為基礎級、增強級、優秀級、卓越級和引領級5個級別,企業可選擇IaaS模塊、PaaS模塊、業務應用模塊等部分分別評估云計算價值成效,并獲取相應水平等級證書。《企業云資源效益度量模型》通過定因、定則、定權、定級4個步驟,對企業業務云資源效益進行專業度量。資源效益定因是確定云資源效益涉及的所有因子,并按照通用行業因子與業務專屬因子對其進行分類,根據因子之間關系,從成本、業務、安全3個方面出發,自上而下逐級細化效益因子。資源效益定則是確定各效益因子的量化規則,針對所有效益因子設定分級要求,將各類因子進行統一量化,從低到高根據業務云資源相關能力的深度、廣度與相關產出的高低,設置量化規則。資源效益定權是確定效益因子在度量模型中的權重,通過AHP層次分析法,對資源效益因子進行權重賦值,結合通用權重與業務適應性權重生成的業務專屬權重進行資源效益度量。資源效益定級是確定云資源效益度量最終等級,對業務效益因子進行統一評估、量化后,將結果與因子權重進行計算,最終得到資源效益等級。在整個效益度量過程中,企業可全方位診斷業務資源使用、效益、能力等情況,并了解分析自身資源使用問題或能力短板,為業務云資源優化策略的規劃和更新提供數據支撐。
企業云優化發展展望
隨著企業上云范圍不斷擴大、用云程度逐漸加深,企業上云用云進入了新周期,環境的變革引發了云優化領域發展新態勢。一是云計算部署模式推陳出新,帶動上云用云新需求。混合云、專有云等云計算部署模式逐漸成為主流,代替傳統的單一部署模式,隨之而來的是更加復雜的消費模型和運營體系,環境的變化為企業上云用云帶來更多挑戰,優化的需求也隨之增加。二是企業用云行業屬性顯著,云優化治理應因地制宜。云計算在各個行業中的應用不斷深化,上云用云的場景更加豐富多樣,云優化治理需要根據場景需求進一步細化指標和要求。三是云優化產業合作持續加強,產品工具將日益完善。在產業政策的推動下,云計算技術在近年來得到快速發展,微服務、容器、資源運維等云計算技術將在未來繼續升級,為企業上云用云優化提供更先進的手段,幫助企業進一步釋放云計算價值。四是云優化標準體系逐步完善,規范并指導企業上云用云。隨著越來越多的企業認識到云優化的重要性,優化標準體系也將逐步建設完善。標準為企業優化效果和優化服務質量提供基礎保障,為優化能力建設和服務選擇提供更加專業的指導。