聚焦聯機交易分析一體化,巨杉數據庫湖倉一體&云產品全線升級
2021年5月15日,金融級分布式數據庫廠商 SequoiaDB巨杉數據庫 舉行了2021年春季發布會。在本次發布會中,巨杉數據庫基于「湖倉一體」架構,針對不同的業務需求場景細分出全新的產品線。同時進行了最新的SequoiaDB Cloud數據庫云平臺操作演示,并將于近期邀請企業客戶進行SequoiaDB Cloud測試。
數字化轉型在過去10年間持續帶動IT技術發展,今天企業面對的數據環境已經從單一的結構化表單數據,擴展到包括結構化、半結構化和非結構化的多類型業務場景。近年來,面向全新數字化業務的混合數據場景,企業數據量已經形成爆炸性的增長趨勢,推動著數據庫技術的發展。在2011年首次提出“數據湖 DataLake”的概念后,業界于2020年結合云原生的架構又再次提出“湖倉一體 Data Lakehouse”的定義,讓大數據時代迎來了全球變革的一年。
巨杉數據庫聚焦于海量數據的全新場景,2011年產品投入研發之初,就專注于多模能力的“數據湖”產品,并于2013年正式發布首個商用版本。2015年后,巨杉數據庫更逐步加入數據分析引擎及跨引擎事務一致性能力,為客戶提供具備海量聯機數據交易及分析能力的「湖倉一體」數據基礎設施。在金融銀行業生產環境中,巨杉數據庫運行時間最長的集群已經超過7年,最大單客戶集群規模達300臺物理服務器,所管理的單集群最大數據量達到1萬2000億條。無論在物理服務器部署、私有云或公有云環境下,巨杉數據庫均能夠通過同一套軟件架構,實現跨平臺、跨底座的快速部署與應用。
巨杉數據庫聯合創始人兼CTO王濤表示,「湖倉一體」是一類技術架構的統稱,而不是某個產品。巨杉數據庫對這類技術架構的布局最早可追溯到2015年,在業界形成統一認知的概念之前,就提前5年利用其特點協助客戶落地湖倉一體數據架構。當前巨杉數據庫已經在民生銀行、廣發銀行、恒豐銀行、渤海銀行等股份制銀行;廣東省農信、吉林省農信、四川省農信等省級農信行;上海銀行、長沙銀行、廣州銀行等城商農商行;以及PICC人保、中國結算等超過100家頭部金融銀行業客戶規模化生產上線。
「湖倉一體」海量聯機交易及分析的數據基礎設施
在數字化轉型的全新技術趨勢中,數據平臺需要同時承載聯機業務與分析能力,因此Data Lakehouse架構并非單純為了OLAP分析而設計。Data Lakehouse可以支持聯機交易、流處理和分析,并且同時支持結構化、半結構化和非結構化數據的存儲。因此,Data Lakehouse作為數據基礎設施,其真正的價值在于打通不同業務類型、不同數據類型之間的技術壁壘,實現交易分析一體化、流批一體化、多模數據一體化,最終降低數據流動帶來的開發成本及計算存儲開銷,提升企業的運作的“人效”和“能效”。
本次發布會中,面向客戶對「湖倉一體」各個不同場景的需求,巨杉數據庫細分出4大產品線。
·SequoiaDB-DP數據融合平臺:面向數據中臺的創新數據底座,數據實現一次寫入、多引擎實時可讀,并提供增強的數據分析引擎。各業務團隊間可以充分實現數據融合,實現數據的交易分析一體化、流批一體化、多模數據一體化,讓更多業務的海量數據處理能力從T+1提升到T+0。
·SequoiaDB-TP事務型數據庫:面向海量數據聯機交易及微服務的創新數據底座,兼容3大SQL關系型數據庫語法,提供RR數據隔離級別及跨引擎數據一致性能力。開發者可以放心地將事務一致性邏輯,交由數據庫層進行處理,并自由地選擇需要的SQL引擎,讓開發人員回歸到純粹的業務設計,提升企業研發“人效”。
·SequoiaDB-CM內容管理數據庫:面向非結構化數據治理的創新數據底座,為其存儲的每一個對象賦予標簽、描述和內容。企業可以基于這些信息進行統一有效的管理、分類、檢索和查詢,實現非結構化數據治理。同時實現內容管理平臺從“資源消耗中心”向“數據價值中心”轉型,提升企業數據管理“能效”。
·SequoiaDB-DOC文檔型數據庫:提供MongoDB引擎的兼容語法,可以有效協助客戶進行文檔型數據庫的國產化遷移,為信創上下游提供金融級的數據基礎設施。
各個產品線均基于統一的SequoiaDB分布式數據庫內核,可以按需獨立部署,也可疊加使用。基于「湖倉一體」架構,降低數據流動帶來的開發成本及計算存儲開銷,提升企業海量數據處理的“人效”和“能效”。
SequoiaDB Cloud打破部署邊界,跨多云靈活部署
近年來越來越多企業開啟了“上云之路”,云計算的重要性在業界已經毋庸置疑。企業的云計算落地,往往會按自身的需求,選擇使用不同能力的云廠商。一些企業甚至會選擇多家云廠商的IaaS平臺作為基礎設施,這就好比以往我們選擇多家服務器廠商構建基礎設施一樣。作為新一代分布式數據庫,SequoiaDB Cloud面向不同的云廠商,提供跨公有云及私有云「跨多云」的部署能力。
巨杉數據庫早在2018年即開啟了跨多云統一部署的研發,目前已經形成一套可以同時滿足裸機、私有云以及公有云環境部署的平臺架構。巨杉數據庫已經在多家銀行客戶實現了基于多廠商云平臺的大規模生產環境落地,同時將在今年正式推出訂閱模式,進一步實現跨騰訊云、華為云、亞馬遜等公有云環境的數據庫云服務。
深耕數據沃土,提升數據價值
隨著企業數字化轉型的深入,企業對海量大數據的實時聯機處理(包括聯機交易和聯機分析)需求越來越迫切。一方面,面對這些全新的應用需求,企業級的商業化產品可從企業的核心訴求出發,穩健地滿足企業的應用需求。另一方面,面對業務場景帶來的挑戰,企業該如何應對底層的數據架構進行變革,湖倉一體無疑提供了明確的變革方向。巨杉數據庫表示,未來巨杉將持續秉承“堅持以客戶為中心”的核心價值觀,聚焦于「湖倉一體」架構的分布式技術創新,與上下游合作伙伴生態共同深耕數據沃土,提升數據價值,為客戶提供安全、穩定、可靠的金融級數據基礎設施。