主流NoSQL數據庫評測之Tokyo Cabinet
本篇要評測的NoSQL產品是Tokyo Cabinet和Tokyo Tyrant,Tokyo Cabinet是一個性能優秀的數據存儲引擎,而Tokyo Tyrant則提供了訪問Tokyo Cabinet數據的網絡接口。這是一個很成熟的產品,在國內外也有眾多的成功案例。
一、Tokyo Cabinet和Tokyo Tyrant簡介
Tokyo Cabinet(簡稱TC)和Tokyo Tyrant(簡稱TT),顧名思義,是源自日本的開源項目。由FAL Labs維護,主要的開發人員是Mikio Hirabayashi。最早應用在日本最大的SNS網站mixi.jp上成功后而聲名鵲起。
TC是一個用C寫的數據存儲引擎,以key-value的方式存儲數據,支持Hash、B+ tree、Hash Table等多種數據結構。同時提供了C、 Perl、 Ruby、Java和Lua等多種語言的API支持,但是如果通過網絡來訪問,就需要用TT。TT同樣是用C寫的,支持從網絡端高并發、多線程的訪問TC。另外TC/TT支持master/slave架構,可以通過配置實現高可用性,這也是很不錯的一個特性。
TC因為支持靈活的數據結構而倍受歡迎,特別是Hash Table類型,很像傳統的關系型數據庫,只是每條存儲記錄的列是自由定義的,可以通過列作為條件來查詢,十分方便。這是很多key-value結構的NoSQL產品所不具備的特性。當然,Hash Table類型和Hash、B+ tree相比存取效率會低一些,任何事物都是有兩面性的,在帶來高度靈活度的同時,必然要犧牲部分的效率。
TC/TT是一個久經考驗的很穩定的產品,在千萬及以下數據量級別表現出色。但是開發者由于種種原因,已經很長時間沒有更新版本了,而是推出了對應升級產品,叫做Kyoto Cabinet和Kyoto Tycoon,這也給TC/TT的前景帶來了不明朗的因素,很明顯作者是鼓勵人們使用升級的產品,但是由于新產品沒有更多的成功案例,在業界的影響力反而不如TC/TT,因此在現階段,TC/TT仍然是一個不錯的NoSQL選擇。
二、測試說明
1、測試環境
TC/TT部署在一臺PC 服務器上,配置如下:
CPU為Xeon 2.80GHz *4
內存為4G
硬盤為一塊400G SATA盤
操作系統為64位CentOS 5.3版本
2、測試方法
這里仍然采用第三方實現的PHP客戶端進行測試,網址為http://pecl.php.net/package/tokyo_tyrant,這是一個標準的PHP擴展程序,可以編譯到PHP運行環境中。要說明的是,這個PHP客戶端實現的是TT接口,肯定比使TT自帶的tcrtest效率要低一些,但是我們的測試要盡量模擬實際的生產環境,所以這里使用了第三方的PHP客戶端。
為了不對測試服務器產生額外的影響,測試客戶端部署在另外一臺獨立的服務器上,運行的PHP的版本是5.3.5,web server是Nginx 0.8.54,通過fastcgi的方式調用PHP服務。使用apache ab工具實現多個請求和并發操作。
為了更全面的反應TC/TT的性能,我對B+ tree和Hash Table兩種數據庫類型分別進行了測試,就使用上文提到的ttserver示例語句來建立測試數據庫,每個類型的測試又分為兩個步驟,首先是寫操作,通過500個請求,每個請求寫入10000條記錄,并發度為2來共寫入500萬條數據,數據的key為數字1到5000000,value大小為100個字節。然后是讀操作,也是用500個請求,每個請求隨機根據key值讀出10000條記錄,并發度為10共讀出500萬條記錄,評測的重點是寫入和讀出數據的時間,以及在此過程中服務器的資源使用情況。
三、安裝和使用
1、下載相關軟件的最新版本(TC、TT和TC的lua擴展):
- [root@localhost tctt]# wget http://fallabs.com/tokyocabinet/tokyocabinet-1.4.47.tar.gz
- [root@localhost tctt]# wget http://fallabs.com/tokyotyrant/tokyotyrant-1.1.41.tar.gz
- [root@localhost tctt]# wget http://fallabs.com/tokyocabinet/luapkg/tokyocabinet-lua-1.9.tar.gz
注意這里的lua擴展是可選的,如果不需要使用lua接口,可以不必安裝。
2、安裝lua腳本,注意這里不能通過yum的方式安裝,否則后面裝tt時會提示找不到lua.h文件:
- wget http://www.lua.org/ftp/lua-5.1.4.tar.gz
- make linux
- make install
安裝過程中一般會報錯如下:
- luaconf.h:275:31: error: readline/readline.h: No such file or directory
- luaconf.h:276:30: error: readline/history.h: No such file or directory
通過yum安裝readline-devel即可:
- yum install readline-devel
3、安裝TC、TT和TC的lua擴展,注意的是如果要使用LUA接口,那么編譯TT的時候要加--enable-lua參數:
- [root@localhost tctt]# tar zxvf tokyocabinet-1.4.47.tar.gz
- [root@localhost tctt]# cd tokyocabinet-1.4.47
- [root@localhost tokyocabinet-1.4.47]# ./configure
- [root@localhost tokyocabinet-1.4.47]# make
- [root@localhost tokyocabinet-1.4.47]# make install
- [root@localhost tctt]# tar zxvf tokyocabinet-lua-1.9.tar.gz
- [root@localhost tokyocabinet-lua-1.9]# make
- [root@localhost tokyocabinet-lua-1.9]# make install
- [root@localhost tctt]# tar zxvf tokyotyrant-1.1.41.tar.gz
- [root@localhost tctt]# cd tokyotyrant-1.1.41
- [root@localhost tokyotyrant-1.1.41]# ./configure --enable-lua
- [root@localhost tokyotyrant-1.1.41]# make
- [root@localhost tokyotyrant-1.1.41]# make install
至此就安裝完成了,整個過程很簡單,當然安裝過程可能需要一些其他的程序包,可以根據提示進行安裝即可。
TT提供了很多命令行工具來管理數據庫,比較常用的兩個是ttserver和tcrmgr。
Ttserver的用法如下:
- ttserver [-host name] [-port num] [-thnum num] [-tout num]
- [-dmn] [-pid path] [-kl] [-log path] [-ld|-le] [-ulog path]
- [-ulim num] [-uas] [-sid num] [-mhost name] [-mport num]
- [-rts path] [-rcc] [-skel name] [-mul num] [-ext path]
- [-extpc name period] [-mask expr] [-unmask expr] [dbname]
各個參數的說明可查看官方文檔,這里就不一一列舉了。我們可以建立一個hash table類型和一個B+ tree類型的數據庫:
- ttserver -host 192.168.0.35 -port 11301 -thnum 8 -dmn
- -pid /home/tc/test_data/test_data_b.pid
- -log /home/tc/test_data/test_data_b.log -le
- -ulog /home/tc/test_data/ -ulim 128m -sid 1 -rts /home/tc/test_data/test_data_b.rts /home/tc/test_data/test_data.tcb
- ttserver -host 192.168.0.35 -port 11302 -thnum 8 -dmn
- -pid /home/tc/test_data/test_data_t.pid
- -log /home/tc/test_data/test_data_t.log -le
- -ulog /home/tc/test_data/ -ulim 128m -sid 1 -rts /home/tc/test_data/test_data_t.rts /home/tc/test_data/test_data.tct
注意最后一個參數的擴展名tcb和tct決定了數據庫的類型分別是B+ tree和table。
通過tcrmgr命令行工具可以管理遠程數據庫,比如我們要查看key為1的記錄可以這樣操作:
- [root@localhost tc]# tcrmgr get -port 11301 192.168.0.35 1
要了解更詳細的信息,讀者可以參看官方文檔。
#p#
四、測試結果
1、B+tree類型寫操作
成功寫入500萬條記錄,共耗時739秒,平均每秒寫入數據6766筆。數據文件大小137M。寫入過程中,服務器內存、CPU和磁盤等資源使用情況如下圖所示:
可見,CPU使用率平穩,Idle值穩定在73到83之間,wait值穩定在7到12之間。內存分配上的變化較大,主要用來緩存數據,cache部分上升了1.1G,但是沒有交換區到內存的換入換出。磁盤IO表現有周期性的上下波動,估計和TC的實現機制有關,數據先寫入內存緩沖區,然后定期的刷新到磁盤。
2、B+tree類型讀操作
成功讀出500萬條記錄,共耗時1171秒,平均每秒讀出數據4270筆。
讀數據過程中沒有發生磁盤IO。CPU較繁忙,Idle值穩定在38左右,等待CPU資源的進程一直在1到6個之間。內存表現平穩沒有波動。
3、Hash Table類型寫操作
成功寫入445萬條記錄,寫入失敗55萬條記錄,共耗時1560秒,平均每秒寫入數據2853筆。數據文件大小538M。寫入過程中,服務器內存、CPU和磁盤等資源使用情況如下圖所示:
CPU使用率較平穩,Idle值穩定在60到80之間,wait值最高在50左右,穩定在20到40之間。內存cache部分上升了0.7G用于緩存數據。磁盤IO表現有呈階梯狀的上升,最后達到100%,導致無法成功寫入數據。
4、Hash Table類型讀操作
成功讀出500萬條記錄,共耗時175秒,平均每秒讀出數據28571筆。
讀數據過程中沒有發生磁盤IO。CPU較繁忙,Idle值穩定在37到41之間,等待CPU資源的進程一直在1到9個之間。內存表現平穩沒有波動。
五、總結
通過以上測試結果可以說明,TC/TT寫入的數據的時候,先緩沖到內存中,然后通過一定的機制寫入磁盤,這也是寫的效率較高的原因,但是由此帶來了周期性的磁盤繁忙,也可能有丟失數據的風險。寫入的數據完全緩存到了文件系統中,所以cache部分占用的內存大量增加,這也是讀取數據的時候沒有發生磁盤IO的原因。B+ tree類型寫入性能十分優異,令人驚訝的是讀出的速度反而慢于寫入的速度。Hash Table類型寫入性能一般,但讀取性能良好。總體上來說TC/TT在非海量數據的情況下表現不錯,服務器資源占用穩定,讀寫效率較高。
【編輯推薦】
- Mongodb源碼分析之Mongos分析
- Mongodb源碼分析--內存文件映射(MMAP)
- 走進MongoDB的世界 展開MongoDB的學習之旅
- 淺析Mongodb源碼之游標Cursor
- 野心勃勃的NoSQL新貴 MongoDB應用實戰