SequoiaDB CTO:企業級NoSQL的發展之路
幾年后的今天,大數據的熱潮開始影響傳統行業。隨著企業信息化、社交化和移動化的水平不斷提升,傳統數據庫的瓶頸日益顯現。對于這些企業而言,他們開始從一個新的角度重新審視數據戰略。近日,記者采訪到SequoiaDB巨杉軟件公司CTO及總架構師王濤,向我們分享了他的創業歷程,以及企業級NoSQL的發展之路。
從DB2工程師轉身NoSQL創業者
王濤曾經是DB2領域的專家,作為IBM DB2全球最高技術專家小組的成員,參與了IBM下一代大數據平臺的架構規劃,精通數據庫內核及體系結構。在IBM多倫多實驗室工作了八年后,王濤選擇了回國創業,目前擔任巨杉軟件公司CTO及總架構師,成功研發了自主產權的NoSQL數據庫——SequoiaDB(巨杉數據庫)。
SequoiaDB巨杉軟件公司CTO及總架構師 王濤
據了解,SequoiaDB是一款完全自主研發的文檔型NoSQL分布式數據庫。SequoiaDB 1.0發布于2013年4月,主要向政府、電信、金融、電力和互聯網等擁有海量業務數據的行業提供大數據解決方案,目前客戶已包括國內知名銀行、電信及互聯網企業。
談到為何從DB2轉至NoSQL,王濤認為主要有兩個原因,一是關系型數據庫的沒落,二是企業級NoSQL潛力巨大。在很多程序員和DBA的眼中,關系型數據庫才是王道。事實并非如此,在與全球財富500強的用戶交流中王濤發現,傳統數據庫并非適合所有場景,也存在諸多技術局限性,如數據模型僵硬、可擴展性差、處理海量數據時存在性能瓶頸、缺乏處理半結構和非結構化數據的能力等。關系型數據庫稱霸市場的時代已經過去了。
另一方面,NoSQL經過這幾年的發展已經日趨成熟,應用場景也已不再局限于互聯網企業,而逐漸蔓延至傳統企業。有預測稱,NoSQL特別是文檔型NoSQL在未來2-5年內將會規模進入傳統企業。企業級NoSQL將成為未來數據庫市場的發展趨勢。
SequoiaDB——企業級NoSQL
預見到NoSQL在傳統企業的發展潛力后,王濤開始了SequoiaDB的研發。與其他NoSQL不同,SequoiaDB主打企業級,即能夠適應傳統企業中的IT環境。他在與傳統行業用戶的交流中發現,現有的文檔型NoSQL產品中忽略了很多企業級需求,如事務、SQL支持、與Hadoop系統的整合等。
于是在年初發布的SequoiaDB 1.0中加入了以上企業級功能,并將在下一個版本中(SequoiaDB 1.2預計在9月底發布)增加數據壓縮功能,同時索引和數據可以在文件系統中分離以提高讀寫性能,還可以運行在IBM power機器上,這都是其他NoSQL所沒有的獨特優勢。除了傳統企業,企業級NoSQL在廣大中小互聯網企業中也有強烈需求。
另外,SequoiaDB還可以根據企業的需求進行定制化開發,這是國外NoSQL廠商無法比擬的優勢。即使企業具有較強的研發實力,開源數據庫引擎的定制化改動也只有廠商研發團隊才能完全駕馭。這也是SequoiaDB為什么沒有使用任何開源數據庫引擎和代碼的原因之一。
SequoiaDB是一款文檔型NoSQL,被認為是最接近傳統關系型數據庫的NoSQL。文檔數據庫的核心是數據嵌套,將原本一些星形模式(Star Schema)的數據嵌套在同一條記錄中以減少表之間關聯的需求。這種設計可以從某種程度上大大簡化傳統數據庫復雜的關聯問題,同時由于擺脫了關系模型里面的強一致性的限制,文檔型數據庫還可以做到水平擴張與高可用。因此王濤認為,文檔型NoSQL的應用范圍要比其他NoSQL廣泛許多。
NoSQL取代關系型數據庫?
談到NoSQL與傳統數據庫的關系,王濤表示,NoSQL不會取代關系型數據庫,而會與關系型數據庫長期并存。NoSQL相對于傳統數據庫的發展歷程而言還很年輕,目前NoSQL主要用于對關系型數據庫的補充,在其不適用的領域填補進去。
關系型數據庫的核心是強一致性的關系模型,當初的設計理念是將ACID放在首位,其次考慮性能與可擴展性。而當人們發現并不是所有的數據都要求那么強的一致性,同時對于性能和數據量的需求越來越高時,NoSQL應用而生。
NoSQL主要將可擴展性放在首位,而高可用或一致性則放到了第二位,這種設計與原本的關系模型產生了極大的差異。尤其在當今大數據時代影響下,NoSQL勢頭漸強。大數據領域強調的是分布式計算,而關系型數據庫為了維持強一致性需要在實體間進行大量數據交互。因此分布式計算是關系模型的一個不能適用的領域。
對此,王濤總結到,企業在需要強一致性的場景時,最好使用關系型數據庫。在需要分布式計算和高性能存儲的場景時,考慮使用NoSQL。其余的場景大多數人依然會選擇關系型數據庫,但有超過70%的現有關系型數據庫場景其實是可以用NoSQL替代的。隨著NoSQL的發展,從成本和易用性角度出發,相信越來越多的用戶會開始使用NoSQL。
小結
SequoiaDB的出現將NoSQL從互聯網推向企業級,彌補企業中關系型數據庫的應用盲點,幫助企業從非結構化數據中獲得價值。中國是天然的大數據搖籃,相信會有越來越多的創業企業關注大數據,關注NoSQL。