在混合云中管理數據庫:八個關鍵注意事項
在混合云數據庫環境中,有些數據在本地存儲和管理,有些數據被移動到公共云。因此,在混合云中運行數據庫引入新的數據管理注意事項,必須解決這些注意事項以確保數據安全、準確并符合法規,同時確保數據能夠得到有效處理。
什么是混合云?
混合云結合公共云服務與傳統企業IT基礎設施(通常設置為私有云)。企業 IT 方面可能包含服務器,這些服務器由企業在其自己的設施中直接管理的服務器,或托管在與其他用戶共享的第三方數據中心中。有些應用程序使用熟悉的內部IT流程進行管理,而其他應用程序則通過特定于云的流程進行管理。
混合云數據庫部署將相同的概念擴展到數據本身。但技術研究咨詢公司Everest Group的合伙人Yugal Joshi表示,企業是否需要采用混合云數據庫模型,這應該取決于,需要數據庫在混合云的應用程序和工作負載需求。如果是這種情況,混合架構可以為底層應用程序提供補充優勢-通過簡化對所需數據的訪問。
盡管它們通常比本地數據庫系統提供更低的成本和更大的靈活性,但云服務并不是對每個企業或應用程序都適用。Joshi表示:“隨著數據審查的增加、強大的數據引力、對延遲的工作負載要求、許可復雜性和數據分散化,并非所有數據都可以放在一個地方,例如公共云,這是混合模型可以增加價值的地方。”
對于部署數據庫 混合云的優勢
混合云數據庫環境的好處就像針對應用程序的混合云一樣:提供對自動化云服務的訪問、打開新選項并提高可移植性。
自動化的云服務。 咨詢公司Nucleus Research的研究分析師Alexander Wurm解釋說:“通過使用混合云來部署數據庫,企業可以獲得現代云的好處,例如定期更新和彈性可擴展性,而不會影響安全性和可靠性-由支持關鍵任務工作負載的現有本地基礎設施提供。”
新選項。企業還可以探索新選項。管理咨詢公司Kearney的數字化轉型實踐合伙人Joshua Swartz表示,如果與安全、性能、質量或成本等關鍵變量相關的需求隨時間發生變化,則可以使用更多選項來重新平衡投資組合。
可移植性。混合云數據庫方法還支持跨多個私有云和公共云服務的數據和工作負載可移植性。數據管理和分析平臺提供商1010data公司的首席技術官Terry Sage稱:“這反過來又允許企業選擇跨混合云協調數據和工作負載,從而避免供應商鎖定,實現成本和效率優勢,以及擴展和縮小環境以滿足服務需求的能力。”此外,可移植性可以使恢復和業務連續性規劃更容易,并鼓勵實驗和創新。
在規劃混合云數據庫策略時應考慮的事項
混合云架構提供的好處可以帶來降低成本的新機會;然而,它們也引入新的安全、性能、集成和數據質量挑戰,需要首先解決這些挑戰,以最大限度地利用混合云數據庫戰略。 IT 團隊、數據經理和數據庫管理員在混合云環境中部署數據庫之前應考慮以下問題。
1. 數字化轉型和應用程序現代化目標
最好的起點之一是確定各種目標,以實現業務流程和為其提供動力的應用程序的現代化和轉型。IT管理咨詢公司Capgemini多云管理交付架構師Brian Schneider表示:“企業不僅需要了解業務的數字化轉型目標,還需要了解他們希望通過對現有應用程序和這些應用程序使用的數據庫進行現代化改造所獲得的結果。”其結果應該是為業務和終端用戶提供最有效和最具效益的數據庫選項。
這個過程應該從發現階段開始,應該涵蓋應用程序團隊和業務所有者,以確定當前的架構、應用程序體驗和最終用戶的痛點,然后創建一個轉型路線圖以進行改進。讓利益相關者參與該過程至關重要。數據經理可以幫助利益相關者了解可能影響規劃的本地和云數據庫技術進步。
2. 應用程序和數據庫的適當分組
專注于業務和應用程序目標還有助于確定暫存數據以支持不同應用程序需求的最佳方式。 托管服務提供商Syntax公司首席技術官Colin Dawes指出:“移動應用程序和數據庫需要將應用程序和數據庫適當地分組為邏輯單元。”
創建這些自然斷層線可以幫助數據管理團隊將整體系統劃分為可管理的塊。Dawes警告說,如果弄錯這部分流程,可能會出現性能和穩定性問題,從而導致利益相關者全面拒絕流程。
3. 成本效益分析與其他方法
數據經理需要分析對現有本地數據庫進行現代化改造、遷移到云端或采用混合方法的相關成本和收益。與純云或本地方法相比,混合云的部署和管理本質上會更加復雜和昂貴。數據智能平臺提供商BigID公司客戶服務高級副總裁George Chedzhemov表示:“企業應該計算額外的成本和管理開銷,并通過收益和業務需求來證明其合理性。”
增加的費用可能是值得的,但對于部署新的云數據庫服務,企業還需要仔細權衡所帶來的挑戰,畢竟這些服務作為混合戰略的一部分會帶來額外的困難。Chedzhemov認為,專有方法(例如 AWS DynamoDB或Google Cloud Spanner)可能會限制部署選項。他推薦了基于MySQL、PostgreSQL、MongoDB和Apache Cassandra等開放標準的云服務,以提高跨本地和云服務的兼容性。
4. 數據輸出費用
混合云數據庫策略應包括數據流。原本使用本地數據庫數據傳輸成本可忽略不計,在遷移到混合環境后,數據傳輸成本可能會很高。Sage指出:“這些成本可能很高,并且取決于為支持混合云數據庫策略而復制的數據量。”
通過適當的架構,可以減輕其中一些成本。盡管如此,如果數據流經昂貴的渠道,則應實施適當的控制。
5. 數據延遲
由于不同云服務提供商之間的數據傳輸以及物理資源之間的距離,混合云數據庫也會引入網絡延遲。Sage說,混合方法通常會導致更長的路由和更多的網絡躍點,這可能會增加數毫秒甚至數秒的數據傳輸時間。在規劃時,應考慮網絡延遲和重新審視所選物理區域的決策。她建議道:“有時將不同的云服務提供商托管在相似的地理區域以降低成本和網絡延遲會更有意義。”
在規劃云端或本地節點是否具有更主動或被動的角色時,還需要從延遲的角度考慮配置選擇。例如,主動-主動集群配置通常在私有云和公共云之間具有較少的競爭延遲,Wurm 說,主動-被動配置可能是擁有大量邊緣數據的資產密集型行業的更好選擇。
6. 數據安全
區塊鏈數據庫平臺提供商Fluree公司首席執行官兼聯合創始人Brian Platz表示,管理和保護數據必須成為混合云數據庫戰略的一部分,因為混合云環境的復雜性會增加潛在的攻擊面。他解釋說:“重要的是,在所有可能的環境中繪制數據的架構流程,以及部署安全和治理措施,并在所有可能的環境中管理、部署、移植和虛擬化數據時,保護數據。”
考慮使用持續集成/持續交付測試和版本控制來降低安全風險。探索以數據為中心的安全治理也是值得的,這可以在數據跨各種網絡和云移動時保護數據。
7. 新工具和技能要求
混合云數據庫可能會引入需要解決的新數據工作流。Everest Group公司的Joshi表示,公共和本地系統的數據管理工具集可能會有所不同,這可能會增加運營成本。他建議開發標準操作模型和工具策略,用于擴展、跨技能和即插即用操作。
沿著這些思路,不同的技能可能需要支持這些新的工作流程。Joshi承認:“為公共云尋找人才很困難,但對于混合云來說,情況更糟。”
8.平衡穩定性和簡單性
任何用于存儲和傳輸數據的新基礎設施都有可能產生新的故障點。考慮如何在系統或網絡脫機時最大限度地減少對運營的干擾。Kearney公司的Swartz稱:“解決這個問題有點像保險單,絕對可以創建冗余和故障安全機制,但成本相當高。”大多數公司遵循的方法是根據業務關鍵性對數據進行分層,并僅為最關鍵的數據提供最昂貴的冗余。
同樣重要的是,對需要集成多個系統所需的工作做好準備。每個額外的系統或數據庫都會帶來與核心應用程序和系統集成所需的另一個接口。開發具有較少接口的架構可以降低管理風險。
Swartz說,與純云或本地方法相比,管理混合云環境可能要復雜得多,成本也會更高。更改、更新、補丁和增強都需要更廣泛和更精細的計劃、測試和監控,以避免產生兼容性問題的多米諾骨牌效應。