再談商用數據庫上云的方式與存在的問題
?昨天我發完文章后不小心點開了前陣子注冊的ChatGPT,最近ChatGPT大熱,很多人認為是改變產業格局的人工智能,有人認為頂多算個智障。對于AI產品的看法,就像是不同的人對待廟里的菩薩,信他是神跡,不信是泥胎,沒所謂對錯。注冊賬號后我一直還沒用過,于是把當天寫的文章的問題拿出來問了一下。
ChatGPT的回答和我的觀點差不多,這讓我感到有些驚訝。于是我問了下一個問題。關于VM和RDS的性能問題。
昨天我也討論了RDS與VM的性能問題,不過我在寫文章的時候忽略了一個問題,國內的公有云和私有云的RDS服務大多數都是用裸金屬服務器的,不過RDS并不只是在裸金屬服務器上跑,也可以使用采用了比較好的云存儲的虛擬機。RDS與ECS部署數據庫不僅僅是裸金屬和VM的差異,更多的是RDS是一組完整的數據庫服務。看樣子ChatGPT的回答比我更專業一些。
于是我繼續往下問,ChatGPT的回答依然中規中矩,比較全面。而我昨天表達的觀點是基于目前國內的一些云廠商提供的一些產品,并不全面。
對于今天我們要討論的這個問題,ChatGPT的回答是從另外一個方面的,從安全、合規性、性能、成本、可擴展性、數據遷移等幾個角度回答了這個問題。確實這些都是數據庫上云應該考慮的因素,不過不是我們今天討論的重點。今天我們要討論的問題是,為什么國內的公有云、私有云中少有對商用數據庫的RDS服務。今天討論的重點還是國產數據庫上云的問題,對于ChatGPT我最近也用了一些,看法比較中性,以后有機會再來討論吧。
還是回到我們今天要討論的問題上,國產數據庫上云,甚至再擴大點范圍,商用數據庫上云,會遇到哪些問題呢?
首先是云鎖定的問題,如果企業使用公有云或者商用版的私有云,那么你的云平臺是否支持某種商業數據庫是個關鍵。當然你可以購買高性能云主機來跑數據庫,這樣就不會受到云平臺的限制。不過如果你的應用比較關鍵,或者對響應延時比較敏感,那么哪怕在高性能云主機上跑數據庫,效果也會大打折扣。再加上受到商用數據庫的許可證的影響,云主機的遷移能力也會受到限制,云的能力也會受限。
企業上了某種商業云后就只能受到云廠商的限制,無法自有發展其IT基礎設施,這就是所謂的云鎖定。一旦受到云鎖定的限制,那么企業IT基礎設施的發展就受制于云廠商的策略。要求云廠商支持某種商用數據庫,提供某種商用數據庫的RDS,幾乎是不可能的事情,哪怕給錢,云廠商也不一定愿意幫你做,這里涉及到十分復雜的商業利益,就不展開討論了。
正是因為如此,在容器云上跑數據庫成為一些企業的選擇,因為容器鏡像的構造并不會和云平臺綁定,其靈活性高于RDS。不過大型系統上容器云不是一個好選項,構建優秀的operator也不是任何一個企業都做得到的。
其次是商用數據庫的許可證問題,商用數據庫的許可證并不是按照云平臺來設計的,大部分商用數據庫并不具備云上許可證管理的能力,這也導致商用數據庫提供RDS服務必須由云廠商與數據庫廠商緊密協作才能完成。而目前云廠商與國產數據庫廠商之間因為利益問題的糾葛,很難達成商業利益的一致,云廠商與國產商用數據庫廠商之間的合作熱情都不高。
第三是商用數據庫對于云平臺的支撐也不足,如何安全的在云上運行,便捷的接入云平臺,向云平臺廠商開放監控、診斷、自治等方面的能力,讓云平臺可以更好的運營數據庫服務,商用數據庫廠商并無認真的考慮,因此云平臺廠商要構建國產商用數據庫的RDS的研發成本也過高。
數據庫與云平臺這兩個企業信息化最為關鍵的IT基礎設施目前還處于單打獨斗的狀態,這讓企業信息系統全面上云也面臨巨大的挑戰。有些企業選擇了在云上舍棄商用數據庫,全面采用基于開源數據庫的RDS;有些企業被迫構建應用云與數據庫云兩朵云,將大型系統的商用數據庫部署于數據庫云上,這也加大了企業信息系統的建設成本與運營成本;還有些企業讓大型商用數據庫仍然跑在獨立的服務器上。
以前我也寫過一篇文章,提出過一個想法,如果存在一個團標或者行標甚至國標,能夠讓國產的云廠商與數據庫廠商都遵循,那么商用數據庫接入云平臺就會容易的多,不過這也不是一件容易的事情,需要有強力的推動才能實現。去年國家出臺了芯片CHIPLET的國標,這大大加速了國產CHIPLET的量產,這件事也給了數據庫與云平臺產業的一些啟示,真的出臺這樣的標準,對于國產數據庫廠商和云平臺廠商,都是有益的。?