云計算成本優化:人工智能時代的新戰略
探索人工智能時代云成本優化的新策略,包括Stacklet公司首席技術官Kapil Thangavelu對FinOps、開源和自動化的見解。
在當今動蕩的經濟環境中,企業比以往任何時候都更仔細地審查他們的云賬單。平臺團隊處于這一挑戰的前沿,他們的任務是尋找創新的方法來優化使用并降低成本。為了深入了解這個不斷發展的領域, Kapil Thangavelu是Stacklet公司聯合創始人兼首席技術官,也是CloudCustodian的創建者和首席維護者。他闡述了對云成計算本優化最新趨勢的看法。
不斷變化的云成本格局
問:在您看來,與近幾年相比,今天的云成本前景有什么不同?
答:近年來使云計算成本復雜化并經常增加的幾個基本變化:
1.復雜性增加:隨著組織在云原生時代的擴展,不同的應用程序團隊利用各種云服務,使得使用變得越來越復雜。
2.混合云和多云方法:許多組織正在采用這些策略,這使得管理不同領域的資源具有挑戰性,并將云服務與現有的本地系統集成在一起。
3.人工智能應用的崛起:這些應用從根本上依賴于云基礎設施,并且資源密集。它們通常需要高性能gpu,這比標準CPU實例更昂貴。此外,人工智能應用程序所需的數據量推高了處理和存儲成本。
4.提高效率的壓力:業務領導者在提高效率、減少浪費和更好地了解云使用方面面臨越來越大的壓力。
5.過度供應:這仍然是成本失控的一個重要因素,但賬單不透明使得將成本追溯到特定資源變得具有挑戰性,特別是在部署增長和涉及人工智能的情況下。
6.焦點轉移:雖然組織以前急于采用云提供商的最新功能,但現在更加強調改進的護欄和最佳實踐,以消除和防止云浪費。
現代建筑中成本關聯的挑戰
問:為什么在當今的現代云原生系統和應用程序架構中關聯云成本如此具有挑戰性?團隊在哪些方面需要幫助來降低云成本?
答:強調了成本相關性具有挑戰性的幾個因素:
1.不斷增長的服務復雜性:云中可用的應用程序和服務的絕對數量在不斷增加,這使得優化和控制使用變得困難,特別是在跨多個工程團隊的規模下。
2.臨時組件:云原生系統通常使用臨時組件和動態擴展微服務,這使得很難跟蹤成本并將其歸因于特定的資源或服務。
3.分布式系統:當組織運行帶有相互連接的微服務的分布式系統時,理解單個組件的成本含義變得異常具有挑戰性。
4.使用優化:雖然許多組織都有某種形式的基于費率的優化,但他們需要使用優化方面的幫助。有效地采取行動需要對服務有更好的洞察力,并與工程團隊進行更深入的接觸。
5.缺乏早期實現:如果一個組織從一開始就沒有實現成本管理工具和過程,那么隨著系統的增長,理解支出模式將變得越來越具有挑戰性。
6.實時可見性:目標是提供對公司云平臺、資源和配置的實時、全面可見性,以優化支出,但實現這一目標是一個重大挑戰。
開源解決方案和趨勢
問:你在開源社區中看到了哪些令人鼓舞的趨勢/模式/新技術方法,這些趨勢/模式/新技術方法使云成本方程得到了更好的控制?
答:在開源社區看到了幾個積極的發展:
1.策略標準:像CloudCustodian和FOCUS這樣的項目為跨提供商管理云成本提供了統一的框架。
2.自動化:開源工具正在興起,它們可以在整個基礎設施生命周期中自動化云使用和控制,以消除浪費并實現良好的“成本衛生”。
3.社區驅動的創新:蓬勃發展的開源社區,如CloudCustodian,擁有超過450名活躍貢獻者,可以比單個組織更快地提供更先進的成本管理解決方案。
4.跨提供商支持:像CloudCustodian這樣的工具支持所有主要的云提供商,允許組織跨不同的環境實現一致的治理。
5.實時執行:例如,CloudCustodian允許用戶定義可以跨各種云資源實時自動執行的策略。
FinOps運動和跨團隊溝通
問:你對FinOps運動的總體看法是什么?“財務”和“工程師”今天的溝通是好是壞?什么壞了?需要改進的是什么?
答:注意到進展和持續的挑戰:
1.傳統孤島:在使用和提供云資源的工程團隊和控制預算的財務團隊之間,通常仍然存在脫節。
2.缺乏理解:工程師可能需要立即掌握其決策的成本含義,而財務需要深入了解這些技術選擇的原因。
3.相互沖突的動機:工程師們往往把創新和上市時間放在財務審慎之上。
4.積極的發展:像FinOps基金會這樣的組織已經獲得了突出的地位,并在教育和推動不同團體之間更好的合作方面做得很好。
5.改進的空間:仍然需要在規模上更好地采用治理和自動化,特別是在云使用的成本治理方面,包括上下文信息和自動修復工作流。
6.行為改變:改進的治理和自動化可以在工程團隊中推動行動并加強成本意識行為。
云成本優化的Stacklet方法
問:Stacklet如何適應云成本和FinOps的趨勢?Stacklet在節省成本、利用率、減少移動部件以及不將錢浪費在閑置資源上方面有什么新的和不同的地方?
答:概述了Stacklet解決云成本挑戰的方法:
1.專注于使用優化:雖然許多團隊從速率優化開始,但Stacklet強調使用優化,這需要與內部工程團隊密切合作,以使云資源與業務需求保持一致。
2.解決共同的挑戰:Stacklet旨在解決諸如碎片化的可見性、手工過程、不一致的組織目標以及對及時工程行動的需求等問題。
3.全面可見性:該平臺實時提供所有云資源和配置的清單,并將其與策略執行數據相結合,以獲得云基礎設施管理的準確、情境化視圖。
4.最佳實踐策略:Stacklet提供了預定義的策略來處理常見的安全性、操作和成本優化用例。
5.以開發人員為中心的方法:該平臺專注于開發人員的體驗,與現有的工作流和協作工具集成,以減少變更管理的負擔。
6.自動化工作流:以工程師為中心的工作流可以更快地消除浪費,使團隊能夠專注于創新。
7.智能通信:平臺自動將相關通知分組,并將其路由給正確的涉眾。
8.防止再次發生:Stacklet的自動護欄旨在防止再次發生浪費。
給企業的建議
問:對于那些認為云計算提供商在成本方面對他們的影響太大的企業,您有什么建議?企業能做些什么來使自己處于更好的位置?
答:為企業提供了以下幾點建議:
1.考慮多云:采用一種策略來增強談判能力、優化定價并減少對單個提供商的依賴。
2.比較產品:分析不同的云平臺,為特定用例找到最具成本效益和最有效的服務組合。
3.工作負載優化:認識到基于技術需求、遵從性需求和性能標準的工作負載可能更適合不同的云環境。
4.實現健壯的治理:使用能夠實時檢測和可視化策略違反并自動觸發補救工作流的工具。
5.利用自動化:實現簡化和自動化復雜的使用優化和治理過程的解決方案。
結論
隨著云原生架構和人工智能應用不斷重塑技術格局,云成本優化仍然是平臺工程師面臨的關鍵挑戰。通過采用開源解決方案,促進財務和工程團隊之間的協作,以及利用自動化,組織可以更有效地駕馭這個復雜的領域。
關鍵在于平衡創新和財務審慎,確保云資源得到有效利用,而不會扼殺技術進步。隨著企業不斷擴展其云操作,提供實時可見性、自動化策略執行和優化使用的工具和策略將在推動創新的同時管理成本。