企業(yè)在2022年應(yīng)避免這六大云成本優(yōu)化問(wèn)題
在企業(yè)發(fā)展過(guò)程中,全球大量工程團(tuán)隊(duì)會(huì)將時(shí)間和精力投入到云優(yōu)化上,但研究表明大多數(shù)企業(yè)無(wú)法跟上飆升的云成本。
發(fā)生這種情況的原因有很多,如果企業(yè)不制定解決方案,這種情況還會(huì)繼續(xù)發(fā)生。原因包括低成本的可見性、棘手的云定價(jià)以及確定未來(lái)需求的問(wèn)題。由于這些迫在眉睫的問(wèn)題,企業(yè)會(huì)浪費(fèi)云資源、時(shí)間和金錢。
在本文中,我們將介紹:
- 為什么云成本優(yōu)化勢(shì)在必行?
- 2022年要解決的6個(gè)頂級(jí)云成本優(yōu)化問(wèn)題
1、為什么云成本優(yōu)化如此具有挑戰(zhàn)性?
公共云的按使用付費(fèi)模式給工程團(tuán)隊(duì)帶來(lái)了自由,但事實(shí)證明這種自由是比較昂貴的。
研究表明,大多數(shù)企業(yè)難以應(yīng)對(duì)不斷上漲的云成本。傳統(tǒng)的公共云支出平均超出預(yù)算 24%。這種情況仍然發(fā)生的原因有很多。
這些通常歸結(jié)為低成本可見性、復(fù)雜的云定價(jià)以及預(yù)測(cè)未來(lái)需求的問(wèn)題。所有這些問(wèn)題都可能會(huì)影響企業(yè)的業(yè)務(wù)支出的金額。
云提供商已經(jīng)了解到這一點(diǎn),他們也無(wú)法提供幫助。對(duì)于大多數(shù)企業(yè)來(lái)說(shuō),解碼云賬單可能會(huì)讓人不知所措。這可能會(huì)讓一些工程團(tuán)隊(duì)望而卻步,但選擇忽略云賬單并不能真正解決問(wèn)題。
2、2022年要解決的6大云成本優(yōu)化問(wèn)題
1)被預(yù)訂和儲(chǔ)蓄計(jì)劃所吸引
考慮降低云成本的第一個(gè)解決方案是為企業(yè)團(tuán)隊(duì)當(dāng)前使用的服務(wù)支付更少的費(fèi)用。與按需定價(jià)模式相比,企業(yè)會(huì)選擇儲(chǔ)蓄計(jì)劃或預(yù)訂,因?yàn)樗鼈兙哂休^大的折扣。
預(yù)先支付可預(yù)測(cè)的云賬單確實(shí)令人感到高興。
但是,企業(yè)團(tuán)隊(duì)會(huì)發(fā)現(xiàn)并沒有解決問(wèn)題,企業(yè)只是得到了折扣而已,這里有什么問(wèn)題?
下面一起了解 Pinterest 降低云成本的故事,Pinterest 已提前為 AWS 服務(wù)支付了 1.7 億美元,但仍需額外支付 2000 萬(wàn)美元購(gòu)買額外資源。這超過(guò)了 10%。Pinterest 可能不介意這種規(guī)模的額外成本,但創(chuàng)業(yè)公司可能會(huì)被這些額外的成本所摧毀。
關(guān)鍵是,Pinterest 的故事讓我們明白,預(yù)測(cè)企業(yè)在 1 到 3 年內(nèi)需要多少容量是很困難的。
長(zhǎng)期致力于單一提供商,沒有靈活性,企業(yè)的業(yè)務(wù)會(huì)被鎖定,并且企業(yè)可能需要為不斷變化的業(yè)務(wù)需求付出高昂的代價(jià)。
如何應(yīng)對(duì)儲(chǔ)蓄計(jì)劃?
最好的解決方案是盡可能避免儲(chǔ)蓄計(jì)劃。盡量不要提前購(gòu)買資源,同時(shí)考慮解決云支出的不同選擇,包括:
- 自動(dòng)定量
- 調(diào)整大小
- 資源調(diào)度
- 裝箱
2)屈服于過(guò)度配置的陷阱
當(dāng)企業(yè)選擇的資源大于運(yùn)行工作負(fù)載所需的資源時(shí),就會(huì)發(fā)生過(guò)度配置。這可以使團(tuán)隊(duì)獲得一種安全心態(tài),因?yàn)闆]有團(tuán)隊(duì)希望在關(guān)鍵項(xiàng)目的中途出現(xiàn)中斷。
在某些企業(yè)中,團(tuán)隊(duì)習(xí)慣于擁有比“備份”所需的更多資源。盡管在性能方面這個(gè)選項(xiàng)對(duì)工程師來(lái)說(shuō)是完美的,但它會(huì)增加云浪費(fèi),從而對(duì)企業(yè)的運(yùn)營(yíng)成本造成損害。
過(guò)度配置有什么問(wèn)題?
最簡(jiǎn)單的答案是,過(guò)度配置會(huì)導(dǎo)致云資源浪費(fèi)和不必要的開支,這些開支很快就會(huì)達(dá)到頂點(diǎn)。
在企業(yè)的團(tuán)隊(duì)中鼓勵(lì)過(guò)度配置在未來(lái)會(huì)導(dǎo)致糟糕的結(jié)果。如果團(tuán)隊(duì)習(xí)慣于獲得比工作負(fù)載要求更大的實(shí)例,則需考慮在擴(kuò)展業(yè)務(wù)時(shí)這是如何工作的。云成本將占企業(yè)業(yè)務(wù)收入的很大一部分。
把這筆錢花在一些對(duì)企業(yè)有長(zhǎng)期幫助的實(shí)質(zhì)性的事情上會(huì)更好。例如,關(guān)于品牌和營(yíng)銷,以便企業(yè)可以將其業(yè)務(wù)建立一個(gè)可靠的業(yè)務(wù)來(lái)源。
如何處理過(guò)度配置?
典型的方法是花錢購(gòu)買定制監(jiān)控和成本管理解決方案。通過(guò)調(diào)整建議大小,企業(yè)可以幫助減少團(tuán)隊(duì)對(duì)過(guò)度配置資源的依賴。但是,企業(yè)仍然需要手動(dòng)實(shí)現(xiàn)它們。
另一種解決方案是自動(dòng)化。自動(dòng)調(diào)整大小可以選擇最可能滿足企業(yè)的應(yīng)用程序要求的實(shí)例類型和大小,同時(shí)控制成本。
當(dāng)集群需要額外的節(jié)點(diǎn)時(shí),人工智能驅(qū)動(dòng)的實(shí)例選擇算法會(huì)自動(dòng)選擇驅(qū)動(dòng)最終性能的資源。企業(yè)團(tuán)隊(duì)無(wú)需花費(fèi)時(shí)間和精力進(jìn)行分類,因?yàn)樗亲詣?dòng)化的。
由于過(guò)度配置嵌套在業(yè)務(wù)文化中,因此創(chuàng)建成本優(yōu)化例程以提高性能、可靠性和降低成本至關(guān)重要。自動(dòng)化可能是企業(yè)變革的第一個(gè)重要步驟。
3)受到未使用的云資源的影響
企業(yè)團(tuán)隊(duì)很容易遺忘為項(xiàng)目創(chuàng)建的實(shí)例。
大多數(shù)團(tuán)隊(duì)都在努力處理沒有工作但仍在繼續(xù)增加成本的未使用資源。Adobe就曾犯過(guò)此類錯(cuò)誤,他們每天在 Azure 的計(jì)劃外費(fèi)用高達(dá)8萬(wàn)美元。這些是企業(yè)無(wú)法承受的錯(cuò)誤類型。
這個(gè)問(wèn)題特別適用于同時(shí)發(fā)生各種事件、缺乏資源可見性的大型企業(yè)。
在 IT 團(tuán)隊(duì)的領(lǐng)域之外的額外成本可能占企業(yè)所有 IT 開支的40%。此外,統(tǒng)計(jì)數(shù)據(jù)顯示,影子云的使用量可以達(dá)到已知云使用量的10倍。
未使用的云資源有什么問(wèn)題?
未使用和未管理的云資源會(huì)增加成本,導(dǎo)致復(fù)雜的可持續(xù)性結(jié)果。
數(shù)據(jù)中心使用大量電力和硬件,主要影響企業(yè)的碳足跡。因此,減少云浪費(fèi)對(duì)于減少不必要的支出和相關(guān)的碳足跡非常重要。
4)處理需求下降和高峰的效率低下
大多數(shù)其他應(yīng)用程序會(huì)隨著時(shí)間的推移在使用方面發(fā)生這些變化,但對(duì)于大多數(shù)公司來(lái)說(shuō),在性能和成本之間保持平衡仍然是一項(xiàng)艱巨的任務(wù)。
問(wèn)題是什么?
如果企業(yè)團(tuán)隊(duì)不留意,若對(duì)資源有嚴(yán)格的限制,不斷增長(zhǎng)的流量可能會(huì)產(chǎn)生巨額的云費(fèi)用,或者導(dǎo)致企業(yè)的應(yīng)用程序崩潰。因此,當(dāng)需求低時(shí),總是存在多付費(fèi)的風(fēng)險(xiǎn)。另一方面,當(dāng)需求高時(shí),服務(wù)質(zhì)量可能會(huì)受到影響。
云成本管理解決方案可以監(jiān)控企業(yè)的使用情況,并在超出允許限制時(shí)實(shí)時(shí)發(fā)送通知。這些工具可以就如何根據(jù)不斷變化的需求調(diào)整云資源提供建議。但是,手動(dòng)云管理既繁瑣又耗時(shí)。
這些是企業(yè)需要了解的事情:
- 小心處理流量激增和下降——分別在所有服務(wù)中向上/向下擴(kuò)展資源。
- 確保應(yīng)用于一個(gè)工作負(fù)載的更改不會(huì)影響其他工作負(fù)載。
- 手動(dòng)優(yōu)化和管理資源組,以了解有適合企業(yè)工作負(fù)載的資源。
解決方案是什么?
這是另一個(gè)可以使用云自動(dòng)化來(lái)幫助企業(yè)節(jié)省時(shí)間和資源的領(lǐng)域。
通過(guò)自動(dòng)擴(kuò)展,企業(yè)可以管理上述所有任務(wù)并控制云成本。如果利用容器編排器 Kubernetes,則可以獲得三個(gè)優(yōu)勢(shì):
- Horizontal Pod Autoscaler (HPA)添加或刪除 pod 重復(fù)項(xiàng)以匹配不斷變化的使用情況。它研究企業(yè)的應(yīng)用程序以確定副本的數(shù)量是否應(yīng)該更改。
- Vertical Pod Autoscaler (VPA)減少/增加 CPU 和內(nèi)存使用請(qǐng)求,以幫助企業(yè)根據(jù)當(dāng)前使用情況調(diào)整資源。
- Cluster Autoscaler在支持的平臺(tái)上更改集群中的節(jié)點(diǎn)數(shù)量。
5)拒絕使用 Spot 實(shí)例
如果將其與按需定價(jià)進(jìn)行比較,云服務(wù)提供商會(huì)以大幅折扣提供其未使用的容量。在 AWS 中,Spot實(shí)例的價(jià)格是正常價(jià)格的10%。
Spot實(shí)例有什么挑戰(zhàn)?
當(dāng)企業(yè)競(jìng)標(biāo)備用計(jì)算資源時(shí),無(wú)法知道這些容量可用多長(zhǎng)時(shí)間。Spot實(shí)例具有默認(rèn)持續(xù)時(shí)間;例如,AWS提供了一個(gè)Spot實(shí)例,可以提供超過(guò)5小時(shí)的不間斷時(shí)間保證。
除此之外,服務(wù)提供商可以收回Spot實(shí)例并為企業(yè)提供僅2.5分鐘的簡(jiǎn)短通知。
在那段時(shí)間內(nèi)進(jìn)行更改是不可行的。開發(fā)新虛擬機(jī)也需要更多時(shí)間,因此存在潛在停機(jī)風(fēng)險(xiǎn)。
因此,如果企業(yè)在計(jì)劃使用Spot實(shí)例之前,要了解到會(huì)發(fā)生中斷的情況。它們不是關(guān)鍵工作負(fù)載的理想選擇。
如何管理這個(gè)問(wèn)題?
盡管存在上述問(wèn)題,但對(duì)于可以擁有多個(gè)副本的服務(wù)來(lái)說(shuō),Spot實(shí)例是非常神奇的。大多數(shù)服務(wù)在當(dāng)代架構(gòu)中都是無(wú)狀態(tài)的,這很好,因?yàn)镵ubernetes 就是為這種設(shè)置而構(gòu)建的。
以下是使用Spot實(shí)例的整個(gè)過(guò)程:
- 確定企業(yè)的工作負(fù)載及其管理中斷的能力非常重要。
- 尋找供應(yīng)商提供的實(shí)例。嘗試選擇不太受歡迎的實(shí)例并監(jiān)控它們的中斷頻率。
- 設(shè)置一個(gè)最高出價(jià)以避免價(jià)格立即飆升時(shí)中斷。
- 最好按組管理Spot實(shí)例并請(qǐng)求多個(gè)實(shí)例以增加填充它們的機(jī)會(huì)。
企業(yè)可以手動(dòng)執(zhí)行這些步驟,但要使其正常工作,請(qǐng)為大型配置、設(shè)置和維護(hù)任務(wù)做好準(zhǔn)備。
6)推遲云自動(dòng)化
在這些情況下,自動(dòng)化會(huì)有所幫助。除了上面提到的過(guò)程之外,自動(dòng)化解決方案可以在Spot實(shí)例不可用時(shí)立即提供幫助。
如果企業(yè)處理過(guò)云原生技術(shù),那么自動(dòng)化可能是其業(yè)務(wù)的最佳選擇。云自動(dòng)化為大型企業(yè)的 IT 團(tuán)隊(duì)提供了驚人的優(yōu)勢(shì)。
首先,它減少了配置虛擬機(jī)、創(chuàng)建集群或選擇合適資源的人工勞動(dòng)。此更改可幫助企業(yè)節(jié)省時(shí)間,并允許企業(yè)的團(tuán)隊(duì)處理重要任務(wù)并充分利用其云基礎(chǔ)架構(gòu)。
此外,自動(dòng)化工具提供對(duì)部署至關(guān)重要的頻繁更新。它還顯著降低了人為錯(cuò)誤的幾率,降低了基礎(chǔ)設(shè)施成本,并改進(jìn)了備份流程。
最后,自動(dòng)化使企業(yè)能夠了解整個(gè)業(yè)務(wù)中難以管理的正在使用的資源。簡(jiǎn)而言之,云自動(dòng)化是科技行業(yè)的新常態(tài)。
為什么不應(yīng)該延遲云自動(dòng)化?
如果云自動(dòng)化提供了這么多好處,為什么不是所有企業(yè)都遵循它們?
從對(duì)新解決方案的抵制到對(duì)可能花費(fèi)大量實(shí)現(xiàn)成本的擔(dān)憂,以及對(duì)更新當(dāng)前設(shè)置的需要,自動(dòng)化可能是壓倒性的。
在接受自動(dòng)化方面,麥肯錫的一項(xiàng)研究證明,員工擔(dān)心他們會(huì)被技術(shù)取代,因此需要謹(jǐn)慎處理這個(gè)問(wèn)題。
同時(shí),自動(dòng)化帶來(lái)了各種好處。但是,在2022年推遲云自動(dòng)化意味著您的企業(yè)可能會(huì)錯(cuò)過(guò):
- 為企業(yè)的工作負(fù)載選擇最佳實(shí)例類型和大小。
- 自動(dòng)縮放云資源以管理需求的上升/下降。
- 擺脫未優(yōu)化的資源以降低成本。
- 通過(guò)處理潛在的中斷來(lái)改進(jìn)spot實(shí)例。
- 減少存儲(chǔ)、備份、安全等方面的不必要開支。
解決方案是什么?
處理員工與自動(dòng)化的矛盾是一個(gè)老問(wèn)題,過(guò)去的企業(yè)因粗心大意而遭受損失。最好提醒企業(yè)團(tuán)隊(duì),云自動(dòng)化將使他們從無(wú)聊、重復(fù)的任務(wù)中解放出來(lái),他們可以將精力用于創(chuàng)新。
那么,企業(yè)應(yīng)該如何找到并淘汰未使用的實(shí)例?這就是企業(yè)使用自動(dòng)化的用武之地。
自動(dòng)化的云優(yōu)化解決方案可以監(jiān)控企業(yè)的云使用情況,以防止效率低下和資源緊湊。它們可以自動(dòng)淘汰增加云成本的未使用實(shí)例和進(jìn)程。這對(duì)所有企業(yè)來(lái)說(shuō)都是一種解脫。