國產關系型數據庫大調查
隨著信創改造的深化及國產軟件興起,越來越多的國產數據庫受到大家的關注。近期看到網上幾篇關于國產數據庫代碼起源、開源情況的文章很火,想必廣大企業用戶也很關注這些問題。下文從墨天輪社區及各數據庫廠商官網收集信息,共收錄國產關系型數據庫165家;對信息分析供參考。
? 部分廠家產品采用單一品牌多款產品形式,統計時會拆分處理。
1. 大調查:總覽篇
1).流行度
墨天輪社區提供了流行度評分,其計算方式是參考搜索引擎、趨勢指數、三方評測、生態(社區、高校合作、培訓認證等)情況、專利數、論文數、招聘崗位數、書籍搜索量、海外機構排名(Gartner、IDC)綜合得到的分數。從上述評分可以反映產品流行程度。從下圖反映的情況來看,頭部聚集效應凸顯,前十名的產品流行度總體占比超72%,前二十名產品的流行度總體占比超82%。
2).地域分布
從地區分布來看,頭部效應更加明顯。北京占比最高,在收集的165家企業中,超半數坐落于北京;深圳、上海、杭州也聚集部分廠商。企業地域聚集現象,一方面與人才市場因素有關,一方面也是很多數據庫企業來自于互聯網或傳統行業大廠,與這些大廠分布也有關。
如果加上數據庫流行度評分,各地域的差異就沒那么明顯,深圳、杭州表現突出,武漢和天津則有幾個排名靠前的數據庫頭部廠商。
3).使用場景
傳統數據庫的使用場景,主要分為OLTP和OLAP。如今,更多細化的場景沒提出,如近年比較火的HTAP。很多數據庫產品是可以滿足多種場景,統計中按照支持場景進行分類。如單產品支持多場景或有細分產品滿足此場景,會單獨統計。從下左圖可見,OLTP仍然是主流場景,OLAP次之,HTAP也作為很多新產品主打的理念。如果在疊加上流行度因素,如下右圖可見,支持HTAP產品的流行度明顯較高。也就是說越來越多的頭部廠商也將支持HTAP場景作為其主流使用場景之一。
4).開發模式
隨著開源理念逐步被廣泛接受,正有越來越多的產品選擇開源模式運作。從左圖可見,大部分廠商采用商業開發模式,開源模式還僅占少數。但如果考慮到流行度的問題,情況則大不同。參考右圖,疊加上流行度因素可見,開源占比已接近商業,也就是說頭部的廠商更多采用開源策略。這也與其流行度較高有著密不可分的關系。
2. 大調查:技術篇
1).技術架構
從技術架構演進來看,數據庫走過了單機式、集中式到分布式的發展,目前是多種架構并存的階段。分布式架構以其更好的擴展能力,受到更多的關注。當然我們也需要意識到,分布式因其架構特點決定,會失去一些傳統架構的優點。而對于大部分場景來說,集中式甚至單機架構就可以滿足。從下圖可見,兩種架構產品處于均分的狀態,甚至分布式稍占優。
從場景上來看,不同場景的架構占比還有所不同。對于OLAP、HTAP等領域,因其承載數據規模及算力更大,分布式產品更有優勢,因而分布式也會占比更高。
2).部署環境
從部署環境來看,本地部署與云原生環境并存。多款產品支持在兩種環境中部署。但從整體來看,仍然是以本地部署方式為主,云原生的部署方式占少數,如左圖。從技術架構來看,分布式更容易利用云原生提供的計算與存儲能力,因此更多地支持云原生部署,如右圖。
3).代碼來源
作為基礎軟件之一,數據庫需要較大的代碼工程量。在這其中,完全自研還是利用開源產品快速構建是兩類思路。如下圖來看,從數量來說,獨立自研產品仍然占多數(其中有些產品未明確聲明基于開源構建,因而算為自研)。基于開源構建來說,MySQL和PG是作為流行的兩款開源數據庫產品,大量的商業產品基于其開發。值得關注的是排名第三的openGauss,作為一款國人開源的數據庫產品,眾多商業產品基于其構建值得祝賀。
如果從另一個角度流行度來看,基于PG構建產品的總流行度要超過基于MySQL構建的產品。但這里有個特殊情況,有些登記的產品是單一品牌多款數據庫,但流行度評分是一個,存在一定的偏差。
4).兼容性
數據庫兼容能力,是快速獲得用戶的關鍵,特別是一款新產品。之前國內數據庫市場以海外大型商用數據庫為主,其占據了很大的份額,構建了完整生態。作為國內產品如果想快速被用戶接受,兼容其他擁有較好生態產品是個不錯的做法。從下圖可見,MySQL作為最為流行的開源數據庫,也成為眾多廠商首選的兼容對象,其次是PG和Oracle。
如果我們考慮流行度因素來看兼容性占比,則MySQL仍然為第一,但Oracle、PG整體也占比很高,特別是Oracle成為接近MySQL的第二兼容選擇。