專訪Gbase武新:中國需要屬于自己的數據庫
原創【51CTO獨家特稿】作為業內為數不多的列存儲數據庫,Gbase 8a在數據分析,計算方面擁有天生的優勢。我們看一下業內知名的Sybase IQ,它在數據處理方面的優勢正是列存儲數據庫的體現。51CTO之前還曾報道過《NoSQL那些事:51CTO帶您走進列數據庫》,也是對列存儲的一番討論。
對于國產數據庫,很多IT人員還是抱著舊有的觀念,認為只是抄襲MySQL源代碼的“舶來品”。不管技術細節如何,中國還是需要自己的基礎軟件,哪怕起步還如何喘弱,我們還是要支持自己的國產軟件。
51CTO記者與南大通用CTO武新先生(右為武新先生,51CTO攝)
針對數據分析領域,我們看到業內還是有很多不錯的工具的,比如微軟的SharePoint 2010+SQL Server 2008 R2的組合,不過究竟Gbase擁有哪些優勢?我們還是有些疑慮。武新先生告訴51CTO記者,Gbase 8a這樣的列存儲數據庫在存儲上具備優勢。原本需要1.5TB才能存儲的數據,在Gbase 8a可能只需要十分之一的空間。另外由于列數據庫無需像行數據庫那樣每次都要遍歷所有的行,因此在I/O執行時間上有一定的優勢。當然這種優勢是在數據分析方面的優勢,在事務處理模式下,還是傳統的行數據庫占優。
列數據庫比行數據庫好在哪兒?
提到通用數據庫,我們一般都想到的都是五大數據庫:Oracle、MySQL、SQL Server、DB 2和Sybase。但是分析數據庫這個名詞,想必很多技術人員還不是很了解,認為這是我們中國人自己創造出來的一個新名詞。其實分析數據庫代表著數據分析的意思,主要是幫助大型企業,金融企業和政府對數據進行分析處理。比如51CTO記者在發布會上就聽到身后Gbase用戶的討論,兩位數據中心負責人來自四川成都醫療方面,主要負責的是當地疾病控制中心的數據上傳與分析。在日常工作中需要經常用到數據分析與預測,普通的行存儲數據庫還是存在系統消耗過大,無法快速響應的問題。可以說Gbase在一定程度上還是有其獨到之處的,盡管很多IT人還是對國產數據庫的“原創性”存在懷疑。
此次發布會上武新先生還給大家展示了9臺PC服務器組成的一個Gbase數據庫集群。在20TB到100TB的數據范圍內,處理時間上幾乎不存在差異。武新先生還為記者具體描述了該PC服務器的配置,就是Intel四核服務器CPU,16GB內存和大容量硬盤,總體價格在三萬左右。對于一個數據量在10TB左右的中型企業來說,幾萬到三十萬左右的采購成本還是可以接受的。
NoSQL一直是大家關注的問題,51CTO也就列數據庫是否屬于NoSQL向武新先生提出了疑問。武先生首先肯定的說,列數據庫肯定是要屬于傳統關系型數據庫的,畢竟在列數據庫中還存在著大量的關系,從執行上還是沿用關系數據庫的思想。談到NoSQL,武新先生還是認為NoSQL更多的是運用在互聯網行業,在傳統生產型行業NoSQL的用武之地不大。NoSQL與關系型數據庫應該是一種并行互相促進的關系,兩者還是多互相融合的比較好。
51CTO最近新推出了一個數據庫“也”低碳的話題,主要的理念是通過數據庫優化工作,來減少數據中心CPU的I/O執行時間,達到減少電能使用,減少二氧化碳排放的目的。武新先生在演講中也提到目前采用一定的數據庫技術,可以為中國減少半個核電站的能耗。比如Gbase數據庫可以節省90%的存儲空間,以目前中國300萬臺服務器的規模,其中三分之一用來運行數據庫。每臺服務器大約能耗在500W左右,而每臺服務器每消耗1W電能就要有2W到3W的電能在散熱上。根據以上的數據,得出節約半個核電站的結論就不足為奇了。
數據庫產品是否國產化,最大的問題就是安全問題。掌控著中國數以億計的個人用戶資料的大銀行和電信行業,都是采用外國數據庫產品,假使這些數據外泄,可能對中國人的個人隱私有極大的傷害。就像倪光南院士寫的那封信里說的一樣“中國需要有自己的基礎軟件”。希望今后中國能有更多自己的軟件,保護自己的信息安全。
延伸閱讀
武新,天津南大通用數據技術有限公司CTO(首席科學家),1991年獲得法國波爾多大學計算機碩士雙學位。曾任職法國Oracle近12年,參與過Oracle數據庫的核心技術研發,同時直接設計開發過法國許多大型數據庫應用平臺,包括家樂福、雷諾汽車、空客飛機公司、法國航空公司、法國電信、法國電力、法國國家銀行、法國里昂銀行、法國AXA保險公司和法國經濟部等等。
【編輯推薦】