教你如何利用MySQL學(xué)習(xí)MongoDB之?dāng)?shù)據(jù)存儲結(jié)構(gòu)
在上文中,我們了解了教你如何利用MySQL學(xué)習(xí)MongoDB之安裝篇,本文中我們繼續(xù)我們的學(xué)習(xí)之旅,學(xué)習(xí)其數(shù)據(jù)存儲結(jié)構(gòu)。
1、MySQL的數(shù)據(jù)存儲結(jié)構(gòu)
MySQL的每個數(shù)據(jù)庫都對應(yīng)存放在一個與數(shù)據(jù)庫同名的文件夾中,MySQL數(shù)據(jù)庫文件包括MySQL所建數(shù)據(jù)庫文件和MySQL所用存儲引擎創(chuàng)建的數(shù)據(jù)庫文件。
MySQL如果使用MyISAM存儲引擎,數(shù)據(jù)庫文件類型就包括.frm、.MYD、.MYI
MySQL如果使用InnoDB存儲引擎,數(shù)據(jù)庫文件類型就包括.frm、ibdata1、.ibd
(1)、數(shù)據(jù)庫文件:
.frm文件:存儲數(shù)據(jù)表的框架結(jié)構(gòu),MySQL數(shù)據(jù)庫文件名與表名相同,每個表對應(yīng)一個同名frm文件,與操作系統(tǒng)和存儲引擎無關(guān),即不管MySQL運行在何種操作系統(tǒng)上,使用何種存儲引擎,都有這個文件。除了必有的.frm文件,根據(jù)MySQL所使用的存儲引擎的不同(MySQL常用的兩個存儲引擎是MyISAM和InnoDB),存儲引擎會創(chuàng)建各自不同的數(shù)據(jù)庫文件。
(2)、MyISAM數(shù)據(jù)庫表文件:
- .MYD文件:即MY Data,表數(shù)據(jù)文件
- .MYI文件:即MY Index,索引文件
- .log文件:日志文件
(3)、InnoDB采用表空間:
ibdata1、ibdata2:系統(tǒng)表空間MySQL數(shù)據(jù)庫文件,存儲InnoDB系統(tǒng)信息和用戶數(shù)據(jù)庫表數(shù)據(jù)和索引,被所有表共用;
.ibd文件:單表表空間文件,每個表使用一個表空間文件(file per table),用于存放用戶數(shù)據(jù)庫表數(shù)據(jù)和索引;
日志文件:ib_logfile1、ib_logfile2。
2、MongoDB的數(shù)據(jù)存儲結(jié)構(gòu)
MongoDB對國內(nèi)用戶來說比較新, 它就像是一個黑盒子,但是如果對于它內(nèi)部的數(shù)據(jù)存儲了解多一些的話,那么將會很快的理解和駕馭MongoDB,讓它發(fā)揮它更大的作用。
MongoDB的默認(rèn)數(shù)據(jù)目錄是/data/db,它負(fù)責(zé)存儲所有的MongoDB的數(shù)據(jù)文件。在MongoDB內(nèi)部,每個數(shù)據(jù)庫都包含一個.ns文件和一些數(shù)據(jù)文件,而且這些數(shù)據(jù)文件會隨著數(shù)據(jù)量的增加而變得越來越多。所以如果系統(tǒng)中有一個叫做foo的數(shù)據(jù)庫,那么構(gòu)成foo這個數(shù)據(jù)庫的文件就會由foo.ns,foo.0,foo.1,foo.2 等等組成,具體如下:
- [root@localhost db]# ll /data/db/
- 總計 196844
- -rw------- 1 root root 16777216 04-15 16:33 admin.0
- -rw------- 1 root root 33554432 04-15 16:33 admin.1
- -rw------- 1 root root 16777216 04-15 16:33 admin.ns
- -rw------- 1 root root 16777216 04-21 17:30 foo.0
- -rw------- 1 root root 33554432 04-21 17:30 foo.1
- -rw------- 1 root root 67108864 04-21 17:30 foo.2
- -rw------- 1 root root 16777216 04-21 17:30 foo.ns
- -rwxr-xr-x 1 root root 6 04-21 17:16 mongod.lock
- -rw------- 1 root root 16777216 04-15 16:30 test.0
- -rw------- 1 root root 33554432 04-15 16:30 test.1
- -rw------- 1 root root 16777216 04-15 16:30 test.ns
- drwxr-xr-x 2 root root 4096 04-21 17:30 _tmp
- [root@localhost db]#
MongoDB內(nèi)部有預(yù)分配表空間的機制,每個預(yù)分配的文件都用0進(jìn)行填充,由于有了這個機制, MongoDB始終保持額外的空間和空余的數(shù)據(jù)文件,從而有效避免了由于數(shù)據(jù)暴增而帶來的磁盤壓力過大的問題。
由于表中數(shù)據(jù)量的增加,數(shù)據(jù)文件每新分配一次,它的大小都會是上一個數(shù)據(jù)文件大小的2倍,每個數(shù)據(jù)文件***2G。這樣的機制有利于防止較小的數(shù)據(jù)庫浪費過多的磁盤空間,同時又能保證較大的數(shù)據(jù)庫有相應(yīng)的預(yù)留空間使用。
數(shù)據(jù)庫的每張表都對應(yīng)一個命名空間,每個索引也有對應(yīng)的命名空間。這些命名空間的元數(shù)據(jù)都集中在*.ns文件中。
在下圖中,foo這個數(shù)據(jù)庫包含3個文件用于存儲表和索引數(shù)據(jù),foo.2文件屬于預(yù)分配的空文件。foo.0和foo.1這兩個數(shù)據(jù)文件被分為了相應(yīng)的盤區(qū)對應(yīng)不同的名字空間。
上圖顯示了命名空間和盤區(qū)的關(guān)系。每個命名空間可以包含多個不同的盤區(qū),這些盤區(qū)并不是連續(xù)的。與數(shù)據(jù)文件的增長相同,每一個命名空間對應(yīng)的盤區(qū)大小的也是隨著分配的次數(shù)不斷增長的。這樣做的目的是為了平衡命名空間浪費的空間與保持某一個命名空間中數(shù)據(jù)的連續(xù)性。上圖中還有一個需要注意的命名空間:$freelist,這個命名空間用于記錄不再使用的盤區(qū)(被刪除的Collection或索引)。每當(dāng)命名空間需要分配新的盤區(qū)的時候,都會先查看$freelist是否有大小合適的盤區(qū)可以使用。
【編輯推薦】