上云不等于用好云,SpotMax助力企業低成本上云、用云
盡管新冠疫情對全球經濟發展造成了嚴重影響,但企業還是保持樂觀。一個證據是,在商業實踐、產品和數字化轉型上的支出,將繼續穩定增長。國際知名數據調查機構IDC發布的2020年《全球數字化轉型支出指南》顯示, 2020年全球數字化轉型和服務支出將增長10.4%,達到1.3萬億美元;雖然明顯低于2019年的17.9%,但仍顯現出了企業對于數字化轉型的迫切需求。
作為數字化轉型的重要基礎之一,云計算為企業提供了數字化轉型的核心驅動力,正以超前的速度普及。許多企業借助云計算快速成長,在細分領域取得了驚人成績,但也有一些企業沒能充分利用到云服務“按需使用”的最大優勢,云上成本較高。
為了解決以上問題, 2019年的云棲大會上,阿里云聯合Mobvista匯量科技推出大型彈性集群管理平臺SpotMax,旨在幫助更多企業構建符合云端特點的系統架構,充分利用云端高彈性資源助力企業享受云計算帶來的技術紅利。
SpotMax的故事從一份軍令狀說起
2017年,隨著Mobvista移動互聯網廣告業務的爆發,流量激增進一步帶動企業云成本大幅提升。彼時的Mobvista已經在降低云端成本上做了好幾輪嘗試,包括對低CPU利用率機器的合并淘汰,對數據存儲的優化,購買Resolve Instance預留實例等。但是云資源成本問題仍然給公司帶來了巨大的挑戰。在此背景下, Mobvista創始人段威找到了蔡超,他相信蔡超一定有方法降低Mobvista的用云成本。
朋友公司的一些用云現狀,加之段威的這次邀請,讓蔡超意識到 ,在云端構建成本可控的大規模系統是一個非常有價值的嘗試,蔡超覺得應該為此做一點什么。于是他請辭當時的工作單位正式加入Mobvista,擔任首席架構師一職,并立下軍令狀,將Mobvista的用云成本降低至少40%。
充分利用云端彈性資源,完成軍令狀
進入Mobvista后,蔡超首先對Mobvista的系統架構進行優化,將Mobvista原本的云單體系統向云原生架構進行改造。構建了一個分布式的微服務架構,使得系統更加具有彈性、更高可用性,也能更好地利用云端的高彈性資源。
阿里云全球化部署的數據中心,讓Mobvista離各地用戶足夠近。同時,Mobvista結合阿里云的彈性伸縮服務與spot搶占式實例等基礎設施,研發出一套云端集群管理平臺SpotMax。
彈性伸縮是阿里云的一種資源管理服務,可以根據用戶的業務運行狀況和彈性策略,自動創建和釋放資源。而搶占式實例是阿里云推出的一種低成本競價實例,類似于廣告競價模式。企業需要在創建搶占式實例時指定出價價格,當指定實例的市場價格低于企業出價且庫存充足時,用戶即可按照出價購買并使用該實例1小時。而1小時后,當市場價格高于企業指定價格,實例會自動釋放。
搶占式實例的生命周期(來源于阿里云)
據蔡超介紹,搶占式實例的價格通常情況下僅為按需實例的20%左右、因此利用阿里云搶占式實例,無疑是降低企業用云成本的有效方式之一。但如何降低實例被釋放時對業務造成的風險呢?這是大多數企業使用搶占式實例時最為擔憂的問題,此前Mobvista正是由于這一原因才選擇較為保守的預留實例模式,而非最高性價比的搶占式實例。
對此,SpotMax通過產品化的手段降低搶占式實例的釋放率,尋找資源和成本之間的平衡點,在保證系統可用性的前提下,有效降低了企業用云成本。
最終,Mobvista實現了單位廣告請求成本降低約65%,蔡超完成了當初立下的軍令狀。隨后,為幫助更多企業節省云成本,更好利用云端高彈性資源。Mobvista將自身成功的經驗產品化,聯合阿里云推出了大型彈性集群管理平臺SpotMax。旨在充分發揮阿里云搶占式實例價格優勢的同時,智能化維護并保證集群穩定。幫助更多企業輕松享受更高性價比的優質云服務。
實現了同等算力下,SpotMax最高可為企業節省90% 的用云成本,而在相同的預算內,SpotMax則可以將企業享受的算力提升10倍。
阿里云搭線,SpotMax首戰告捷
SpotMax推出后,很快便迎來了第一家企業用戶。一家轉型DSP廣告投放的公司經阿里云推薦找到了Mobvista。
據了解,該公司在轉型DSP廣告投放業務后,每日所需的用云資源量波動巨大,為滿足資源波峰,需增加大量的用云成本。為解決成本問題,該公司CEO開始思考如何最大化利用阿里云搶占式實例特點,達到既滿足自己企業的彈性業務需求,又盡可能地壓低成本。
了解到該公司的訴求后,阿里云第一時間便想到了SpotMax。阿里云技術同學回憶,“當時,我們首先便想到了通過SpotMax解決這家企業的用云成本問題,因為該企業所面臨的的困境與當初Mobvista所面臨的困境非常類似,同時DSP廣告業務也與Mobvista的業務具有共通性”他認為能夠大幅節省Mobvista用云成本的SpotMax同樣適用于該企業。
蔡超回憶,拿到該企業的需求后,團隊第一時間針對導致其云成本上升的原因進行了分析,很快便發現當時該企業的服務器機型規格大不易伸縮,缺乏靈活性。這也直接導致了流量增加后,該企業用云成本增加,業務拓展難的問題。蔡超表示,目前大多數企業的現有架構都是在云誕生之前搭建的,傳統的架構模型很難有效利用云計算帶來的彈性優勢。他進一步解釋道“目前市場上并沒有一本關于架構的書可以解決企業上云成本高的問題,很多分布式的書,包含MIT相關的書,都是在云之前就寫的,因此并不符合云的特點。”
了解Mobvista已通過SpotMax在過去兩年節省幾千萬美元用云成本支出后,該企業迅速與Mobvista達成了合作。據該企業CEO透露,之所以這么快達成合作,是因為他們自身的業務與Mobvista具有高度的共通性,通過Mobvista的成功經驗,他們 “既看到了遠大的方向也看到了落地的實際行動”,最終通過SpotMax,該企業實現了單位請求成本節約50%,并在財年結算中實現盈利。同時通過SpotMax對原有的架構進行優化后,進一步找到了更多的業務可能性。這對于他們來說,“可謂是意外之喜”該CEO在與阿里云及Mobvista的溝通中如是說道。
全面挖掘云計算技術紅利
現實中,由于企業自身架構不符合云的特點而導致企業用云成本居高不下的案例并不少見。蔡超表示,上云并不等于用好云,上云不是單純地將企業業務平遷到云端,而是一個不斷實踐探索如何用好云的過程。因此,SpotMax在設計過程中充分考慮到了企業上云用云的多方面訴求,不僅是幫助企業節省上云和用云成本這么簡單,還為企業提供更全面的服務。
據蔡超介紹,SpotMax方案共包含三個部分:MaxArch、MaxChaos和MaxGroup。其中MaxArch提供對企業現有架構的評估以及向云端遷移和云原生架構的設計;MaxChaos主要提供混沌工程服務,可幫助企業持續提高系統的可用性;而MaxGroup則是Spot Instance集群管理服務,通過集群防退化、Spot Instance集群推薦及基于強化學習的混合集群負載均衡等,幫助企業節省用云成本。
究竟什么樣的企業更適合使用SpotMax呢?蔡超表示,原則上只要使用云服務的企業,都可以使用SpotMax的服務。不過,擁有大量用戶請求,需要快速響應、與用戶體驗極為相關的場景,SpotMax的作用會更為突出,比如,程序化廣告、電商、電子政務、企業管理服務(CRM,ERP)和高性能計算等行業。
之所以選擇與阿里云合作推出SpotMax,蔡超表示,是由于阿里巴巴擁有服務企業的完整生態。有數據顯示,截至2019年年底,全球已有超300萬家企業在使用阿里云。