構建數據庫生態系統正當時
高德納(Gartner) 報告表示,數據庫自成孤島的時代已經結束。云數據庫成為“更廣泛的數據生態系統”一部分的強烈信號正在不斷增強。上個月,分析小組對頂級數據庫的生態系統參與度進行了評級,結果可能會讓你大吃一驚。
去年12月中旬,Gartner發布了《2023年云數據庫管理系統(CDBMS)魔力象限》報告,分析了在公共云和私有云中運行的事務性和分析性數據庫的市場。19家云DBMS供應商最終進入了這個象限,該象限由AWS、微軟Azure、谷歌云和甲骨文等公司主導。
Gartner分析師確定的一個主要趨勢是,標準數據庫的特性和功能與更廣泛的數據管理工具市場提供的特性和功能混合在一起,而這些特性和功能傳統上不屬于DBMS本身。
過去,數據庫客戶通常求助于獨立軟件供應商(ISV)來實現數據管理功能,如數據沿襲跟蹤、數據治理、數據集成/ETL、數據質量和數據安全。這些功能中的許多都被集中到所謂的數據結構中,以確保各種數據管理過程中的可重復性和一致性。
2023云DBMS的魔力象限(Magic Quadrant;來源:Gartner)
但據Gartner的分析師稱,數據庫供應商正在與數據管理獨立軟件開發商進行更密切的合作,反之亦然。作為數據棧中最重要的一層,數據庫能夠很好地(或者更好地)與其他重要的數據管理產品組合在一起,這是一件很棒的事情,公司必須依賴這些產品才能從數據中獲得價值,同時將成本和風險降到最低。
雖然不是所有的DBMS供應商都以同樣的程度或方式與ISV合作,但根據Gartner的說法,DBMS在數據生態系統中的作用是一個明顯的趨勢。
Gartner寫道:“云DBMS系統已經開始意識到周圍的其他數據管理組件,并與之協作。這并不意味著云DBMS系統將包含其他系統的功能。相反,他們會意識到這些問題,并通過與它們交互來增加更多價值。”
Gartner表示,云DBMS參與到更廣泛的數據生態系統中,“在能力上有了重大的改進”,并“有意識地與它們進行互操作”。“如果說有什么不同的話,那就是這方面的進展比預期的要快,自去年的云DBMS魔力象限以來,有許多重要的供應商發布了公告。”
在數據生態系統中發揮作用的趨勢是一個更廣泛的趨勢,而不是孤立于云DBMS或一般DBMS(早在2019年,Gartner預測云將篡奪大部分DBMS市場,這是正在發生的過程——Gartner表示,2022年55%的DBMS支出在云上,云占整個DBMS市場增長的98%)。
Gartner表示,到2025年,90%的新數據和分析部署“將通過一個既定的數據生態系統,導致整個數據和分析市場的整合。”更重要的是,到明年年底,55%的IT買家將采用數據生態系統。該分析集團表示:“這將整合40%的供應商格局,從而降低成本,同時減少選擇。”
Gartner對一些云DBMS在數據生態系統中的參與給予了更高的評價:
Gartner表示,阿里云最近與MongoDB、ClickHouse和PingCAP等ISV建立了合作關系,這表明其云生態系統得到了改善。Gartner在其魔力象限中表示:“這為第三方數據和分析解決方案提供了更多選擇,同時減少了與阿里云的集成工作。”魔力象限將阿里云列為領導者象限。
Gartner還討論了亞馬遜(AWS)向數據生態系統的轉變。報告指出,這家云計算巨頭擁有強大資源,“可以在DataZone的基礎上,向更加集成的解決方案邁進”。亞馬遜DataZone是一項數據管理服務,于去年10月上市,由數據門戶、數據目錄、數據項目和環境以及治理和訪問控制層組成。然而,Gartner也警告說,不要采用全AWS生態系統,這會引發依賴鎖定問題。
Cloudera因其數據生態系統的工作而獲得高分,被Gartner列入其遠見者象限“Cloudera繼續投資于其開源領導地位,通過其數據生態系統中的開放標準推動社區創新,在所有云數據架構中提供便攜式數據和人工智能服務。”“通過在所有云和內部部署的集中控制平面,它提供了集成的安全性、元數據和治理,具有應用的可觀察性和開放的數據生態系統。”
云提供商提供的生態系統比Cloudera的“集成更緊密”,“更容易使用”。然而,Cloudera致力于多云和混合部署,以及工作負載的可移植性,“是對這種競爭壓力的有效平衡,這種壓力需要持續努力才能保持有效性。”Gartner表示。
Couchbase開發的NoSQL數據庫主要用于交易和操作用例,其在移動和邊緣領域的能力以及其托管數據庫服務Capella的易用性受到了Gartner的稱贊。然而,根據Gartner的調查,Couchbase缺乏生態系統的支持,它將Couchbase置于利基玩家象限。
該分析機構表示:“Couchbase并不具備訪問數據的成熟能力,也不具備向Couchbase世界以外的引擎提供數據的能力,盡管它們在Couchbase的路線圖上。”“在生態系統中與多個引擎進行廣泛交互的能力正在推動多種用例的靈活性和效率提高,最突出的是分析和人工智能。其他非關系型產品也有這種限制。”
被Gartner列為領導者象限的Databricks,其在Unity Catalog上獲得了高分,Unity Catalog是Databricks的元數據目錄和治理中心,適用于Databricks和外部存儲庫中的數據。Gartner還贊揚了Delta Live Tables的數據生態系統,因為它能夠簡化流、批處理和人工智能工作負載的ETL管道開發。
Gartner對谷歌云的數據生態系統參與也有好評,谷歌云也在領導者象限中推出。Gartner特別贊揚了Dataplex,它的元數據/治理層使數據生態系統更加緊密集成。
微軟在領導者象限中也獲得了高分,因為它愿意讓自己的數據庫更加開放,并與其他微軟產品(包括Microsoft 365、Power BI和Purview)合作,但也愿意與獨立軟件開發商(ISV)的外部解決方案合作。
“這為客戶帶來了更加一致的體驗。”“與此同時,微軟Fabric為非微軟系統中的數據帶來了更多的開放性,這有可能減少其客戶對供應商依賴鎖定的擔憂。”然而,一些微軟客戶對微軟DBMS生態系統功能的復雜性表示擔憂,這會損害性能、安全性和成本控制。
SAP是Gartner魔力象限中的遠見者,因其在同一HANA數據庫中運行運營和分析工作負載的能力而受到稱贊。Gartner也很喜歡SAP Datasphere在生態系統中統一SAP和非SAP數據的能力。
“SAP現在通過文件交換、復制和聯合在SAP和非SAP環境之間導入和導出數據的能力更加開放,”Gartner表示。不過很少有非SAP客戶會使用SAP來管理數據。Datasphere很可能被“擁有重要SAP技術”的客戶所使用。
Snowflake開發了一個分析數據倉庫,位于領導者象限,也因其“強大”的生態系統能力獲得了Gartner的認可。“Snowflake推廣了一種易于使用的集成解決方案的理念,輔以強大的數據共享和數據市場故事。”
Teradata是數據生態系統中的另一個數據倉庫提供商。將Teradata置于遠見象限的Gartner喜歡Teradata的QueryGrid功能,該功能“通過智能地在適當的地方下推處理,卸載Teradata機器的周期,并減少必須返回Teradata的數據量,從而有效地實現對Teradata外部數據的訪問。”Gartner表示。
云DBMS顯然具有與第三方數據管理工具和更廣泛的數據生態系統集成之外的功能。但正如Gartner所顯示的,數據庫的生態系統等級正成為數據庫購買者更重要的考慮因素。