分布式數據庫新思維:跨云平臺
譯文這是一種非常簡單而且已經擁有悠久歷史的解決思路:在數據庫中利用一套分布式架構實現請求數據的快速返回。此類方案會在同時間于多臺服務器上運行數據庫查詢操作,而后將來自成百甚至上千臺集群內服務器的返回結果匯總起來進行交付。
即使并不新鮮,這種理念為什么最近又贏得了新的關注?這是因為它成為MapReduce背后的核心機制,而MapReduce正是Hadoop在大數據分析工作中所采用的并行處理模式。這些分布式工作負載近年來被大規模使用,通常與均勻的服務器集群相搭配——也就是說需要運行在大量同樣的服務器設備之上。這種均勻性要求將用戶限制在了單一服務器集群或者單一云環境當中,意味著我們需要為其搭配一種資源類型及成本方案、再無其它可選。
但在迅速興起的多云方案當中,數據處理工作負載運行在那些能夠真正切合工作負載實際需求的云服務之上。目前面向多云架構的積極探索為用戶帶來了將工作負載安置在公有或者私有云服務上,從而為負載自身需求提供最短條件的能力。這同時也允許大家將工作負載運行在那些***成本效率的云服務之上。
跨多個云平臺處理數據實例
舉例來說,當處理流程以查詢形式出現時,啟動這條數據庫查詢的客戶端可能駐留在托管服務供應商的運行環境下。不過它可能會將請求指向Amazon Web Services公有云服務上的多個服務器實例。它同樣可以管理棲身于微軟Azure云環境下的事務型數據庫。此外,它也能夠將數據請求結果保存在本地OpenStack私有云當中。靈活多樣,相信大家已經明白這一特性了。
由此帶來的好處是顯而易見的:大家可以將云服務與工作負載進行混合與匹配,從而在提升性能表現的同時降低使用成本。事實上,我們完全可以根據實際需要將工作負載在不同云環境之間隨意遷移。
時至今日,已經有大量數據庫處理機制選擇云計算服務作為依托——則其使用成本并不便宜。將工作負載在不同云服務之間遷移為那些管理著大型分布式數據庫的使用者帶來了巨大力量,允許他們只選擇那些提供***、***性價比服務的供應商——或者是那些最能滿足其數據庫處理需要的供應商。
當然,這類事務處理方式頗為復雜,而且必然會對管理與自動化提出要求。云管理平臺工具在這方面應該能夠起到作用,因為它們可以提供之前描述的實際處理流程的能力。
請大家保持清醒的頭腦——這種新思路絕不像聽起來那么難以馴服,而擁有更多選擇也永遠不是壞事。
原文鏈接:
原文標題:The right cloud for the job: Multicloud database processing is here