選型避坑-數據庫品牌和數據庫產品是不同的
數據庫國產化替代工作中有很多坑,如果策略不得當可能會引發一系列的問題。目前已經有些企業因為初期替代策略不謹慎而出現了二次遷移的問題。信創數據庫選型中的坑,如果不是對國產數據庫產品十分了解的專家,還真的不太容易避開。上周末在深圳的一個行業閉門會議上,專門請了工信部的專家來給大家宣貫信創產品的定義和相關標準。我也做了一個國產數據庫選型策略的分享。
我的演講結束后,有專家在互動環節提出了一個疑問:他以前一直以為騰訊的TDSQL是基于MYSQL生態的分布式數據庫,但是2023年12月公布的信創數據庫清單里的TDSQL好像是基于PG的集中式數據庫。希望我能給他解解惑。
圖片
上圖是公布的第一批十一款通過測試的國產數據庫,今年稍后會公布第二批。官方公布的信息十分簡單,確實讓正在做數據庫選型的用戶摸不著頭腦。不知道中國信息安全評測中心的官網以后能不能改進一下公示的內容,對每個通過評測的數據庫提供更為詳細的說明。
這樣既避免了用戶產生困惑,又讓數據庫廠商不能借著清單打擦邊球。這是因為清單上所列的不是數據庫廠商,而是數據庫產品,而大多數數據庫廠商的數據庫產品不只是一款。某些數據庫廠商用數據庫品牌來泛指數據庫產品,把沒有通過評測的產品也和通過的產品混淆起來,這給用戶選擇數據庫產品的時候造成了巨大的困擾。
有些廠商比較實在,通過評測產品的命名有很好的辨識度,比如“海量數據庫G100管理系統V2.2”明確說明通過評測的是海量基于openGauss的G100數據庫,不是基于Postgresql的E100。南大通用的送測產品也比較老實,是GBase 8s V8.8,這是Informix生態的數據庫,而不是基于openGauss 的GBase 8c 和數據倉庫GBase 8a。
有些數據庫廠商就顯得有點雞賊了,比如上面提到的TDSQL,TDSQL是一個數據庫品牌,不是一個數據庫產品。其家族中有MySQL生態的TDSQL分布式數據庫,也有基于PG/MYSQL的集中式解決方案TDSQL-C,還有基于POSTGRESQL-XL的TBASE。
PolarDB也和它的互聯網兄弟采用一樣的策略,雖然其家族中包含了PG生態的PolarDB-O、PolarDB-PG,還有MySQL生態的PolarDB-M、PolarDB-X,這幾個數據庫是完全不同的數據庫產品,數據庫核心代碼是完全不同的。但是PolarDB送測的產品名稱就是一個讓人分不清楚的統稱。上面這個目錄里通過評測的 PolarDB 據我了解的情況實際上應該是PolarDB-O V2.0,它不能代表所有的PolarDB家族產品。
以我比較狹隘的心態來揣測這些廠家給產品起名的這種模糊態度,應該是想要為其在市場上渾水摸魚提供方便的。因此用戶在做國產數據庫選型的 時候還是要打起十二分精神,千萬不要踩坑,否則不僅僅是多花了些不必要的費用,更會影響你的數據庫國產化替代進程。
圖片
針對上面的結果,我根據以往的研究,做了一個簡單的整理。東方金信和虛谷的數據庫研究不多,所以不太清楚其產品體系,是否有多款數據庫,其核心之間是否相同,今后如果弄明白再做補充吧。主要是針對一家企業有多個數據庫產品的做了一個分解,黃色條的產品就是通過評測的產品。因為現在國產數據庫產品命名體系十分混亂,可能會有一些偏差,不過也大差不差,可以為正在做國產數據庫選型的朋友提供一些參考。
另外要注意的是,測試是針對具體版本的 ,在一些考核比較嚴格的行業里,版本號對不上也不算,比如人大金倉KingBaseES V8通過評測,但是V9還沒有,不知道今年這批評測中是否有V9,對于監管要求特別嚴格的行業的用戶需要格外注意。
當然,對于一些要求不是很嚴格的企業或者行業,你打打擦邊球也是問題不大的。第二批參測的數據庫有30多款,包含了分布式和集中式數據庫,估計一兩個月后可能會有結果,屆時可供選擇的產品就更多了,大家選擇起來可能就更需要小心了。