MongoDB寫(xiě)入數(shù)據(jù)策略
上篇文章介紹了Mongo讀取數(shù)據(jù)的策略(??MongoDB讀數(shù)據(jù)策略??),主要是readconcern、readpreference兩參數(shù),其中readconcern作用于服務(wù)端,決定了什么時(shí)候能讀取到數(shù)據(jù);readpreference在客戶端配置,決定讀哪個(gè)節(jié)點(diǎn)的數(shù)據(jù)。本文將要介紹Mongo的寫(xiě)入策略,在介紹寫(xiě)入策略前,先簡(jiǎn)單說(shuō)明MongoDB的Journaling特性。
Journaling介紹
MongoDB也有防carsh能力,和MySQL類(lèi)似,也是通過(guò)預(yù)先寫(xiě)日志(WAL)到文件實(shí)現(xiàn),這文件就是Journaling功能。
To provide durability in the event of a failure, MongoDB uses write ahead logging to on-disk journal files.
?日志文件?
開(kāi)啟Journaling功能后,Mongo 會(huì)在數(shù)據(jù)庫(kù)目錄下創(chuàng)建 journal目錄,用來(lái)存放journal日志,以WiredTiger引擎為例,文件格式是WiredTigerLog.<sequence>,其中<sequence>是從0000000001開(kāi)始的零填充數(shù)字。journal日志文件默認(rèn)大小為100 MB,超過(guò)該限制后,將創(chuàng)建一個(gè)新的日記文件,并會(huì)自動(dòng)刪除舊的日志文件,僅保留從上一個(gè)檢查點(diǎn)恢復(fù)所需的文件。所以journal日志文件一般情況下只會(huì)生成兩三個(gè),除非每秒有大量的寫(xiě)操作發(fā)生。
?日志記錄?
journal記錄有這幾個(gè)特點(diǎn):
它包括由初始寫(xiě)入引起的任何內(nèi)部寫(xiě)入操作。例如,對(duì)集合中文檔的更新可能會(huì)導(dǎo)致對(duì)索引的修改;WiredTiger創(chuàng)建單個(gè)日志記錄,其中包含更新操作及其關(guān)聯(lián)的索引修改。
每個(gè)記錄都有一個(gè)唯一的標(biāo)識(shí)符。
WiredTiger的最小日志記錄大小為128字節(jié)。
另外,為了提高存儲(chǔ)效率,MongoDB犧牲了一些CPU性能,對(duì)WiredTiger引擎對(duì)日志數(shù)據(jù)使用壓縮存儲(chǔ),默認(rèn)壓縮方式是snappy壓縮,也支持其他壓縮方式,比如:zstd、zlib等,可以通過(guò)下面方式設(shè)置。
總之,Journaling 是MongoDB中非常重要的一項(xiàng)功能,類(lèi)似于關(guān)系數(shù)據(jù)庫(kù)中的事務(wù)日志。Journaling能夠使MongoDB由于意外故障后快速恢復(fù)。在2.0版本后,默認(rèn)開(kāi)啟了該功能。和MySQL一樣,Mongo 實(shí)例啟動(dòng)時(shí)會(huì)檢查journal日志文件,確認(rèn)是否有需要恢復(fù)的數(shù)據(jù)。不過(guò)由于提交journal日志會(huì)產(chǎn)生寫(xiě)入阻塞,所以它對(duì)寫(xiě)入的操作有性能影響,但在生產(chǎn)環(huán)境中通常還是開(kāi)啟Journaling的。
數(shù)據(jù)寫(xiě)入策略
writeconcern 是Mongo針對(duì)寫(xiě)操作的參數(shù),表示寫(xiě)請(qǐng)求對(duì) mongod 實(shí)例的確認(rèn)級(jí)別,決定數(shù)據(jù)的持久性。它可以用下面三個(gè)選項(xiàng)表示。
?writeconcern 選項(xiàng)?
w指定寫(xiě)操作需要應(yīng)用到多少個(gè)數(shù)據(jù)節(jié)點(diǎn)才能返回成功,可以為0、1、2、3或者majority。
- w: 0 表示客戶端不需要收到任何有關(guān)寫(xiě)操作,就直接返回成功。
- w: 1 表示寫(xiě)主成功,就直接返回成功。
- w: majority 需要收到多數(shù)節(jié)點(diǎn)(含主節(jié)點(diǎn))關(guān)于操作執(zhí)行成功的確認(rèn),具體個(gè)數(shù)根據(jù)復(fù)制集配置自動(dòng)得出。比如,一主兩從3節(jié)點(diǎn)的集群,則需要2個(gè)節(jié)點(diǎn)確認(rèn)寫(xiě)入成功即可。
- w: N(N > 1)表示N個(gè)數(shù)據(jù)節(jié)點(diǎn)確認(rèn)才返回成功。w 值越大,對(duì)客戶端來(lái)說(shuō),數(shù)據(jù)的安全性保證越強(qiáng),同時(shí)寫(xiě)操作的延遲越大。w 設(shè)置的節(jié)點(diǎn)數(shù)越多,等待的延遲也就越大。如果 w 等于總節(jié)點(diǎn)數(shù),那么一旦其中某個(gè)節(jié)點(diǎn)出現(xiàn)故障就會(huì)導(dǎo)致整個(gè)寫(xiě)入失敗,這也是有風(fēng)險(xiǎn)的。另外,針對(duì)Hidden、delayed和priority為0的數(shù)據(jù)節(jié)點(diǎn),官方也特別做了說(shuō)明,如下:
NOTE
Hidden, delayed, and priority 0 members can acknowledge w: <number> write operations.
Delayed secondaries can return write acknowledgment no earlier than the configured slaveDelay.
注意:
a、副本集中Hidden、delayed和priority為0的成員,可以確認(rèn)w: <number>的寫(xiě)操作。
b、延遲節(jié)點(diǎn)的返回寫(xiě)ack,不會(huì)早于配置的slavedelay值 。
如果集群有 3 三個(gè)數(shù)據(jù)節(jié)點(diǎn),在w: majority模式下 ,只需要寫(xiě)入兩個(gè)數(shù)據(jù)節(jié)點(diǎn)即可返回,流程如下:
j表示寫(xiě)操作是否要被持久化,只能選填 true 或 false。
- j:false 表示寫(xiě)操作到cache即算作成功。
- j:true 表示寫(xiě)操作到文件中才算成功。
從3.2版本后,如果指定j:true,即使 w:0 ,只有在請(qǐng)求的成員數(shù)(包括主成員)寫(xiě)入日志后才返回?cái)?shù)據(jù)。因此,j:true設(shè)置保證了MongoDB的數(shù)據(jù)持久化。
Changed in version 3.2: With j: true, MongoDB returns only after the requested number of members, including the primary, have written to the journal.
另外,僅僅j:true 不保證集群 failover 時(shí)發(fā)生回滾的寫(xiě)操作。
j: true does not by itself guarantee that the write will not be rolled back due to replica set primary failover.
wtimeout:返回確認(rèn)的超時(shí)時(shí)間,單位為毫秒。
如果寫(xiě)入操作超過(guò)該值,則返回錯(cuò)誤,即使最終寫(xiě)入是成功了,但數(shù)據(jù)庫(kù)不會(huì)撤銷(xiāo)超時(shí)寫(xiě)入的數(shù)據(jù)。如果沒(méi)有指定 wtimeout 值,則寫(xiě)入操作將無(wú)限期阻塞,wtimeout:0 等同于該選項(xiàng)未設(shè)置值。同時(shí),這個(gè)參數(shù)和 WriteConncern 的w值有關(guān),并且只適用于w大于0的情況。比如:w:0,表示可以超時(shí)無(wú)限大,則不返回錯(cuò)誤;w:1,只和主節(jié)點(diǎn)確認(rèn)的超時(shí)時(shí)間;w:majority,表示需要和多數(shù)節(jié)點(diǎn)確認(rèn)超時(shí)時(shí)間。
?數(shù)據(jù)提交策略?
MongoDB也有和MySQL有類(lèi)似的提交策略,是由 commitIntervalMs 參數(shù)控制,它是日志持久化的間隔時(shí)間(以毫秒為單位)。如果想要更好的數(shù)據(jù)安全,可以設(shè)為每毫秒對(duì)cache中的數(shù)據(jù)做硬盤(pán)層面的sync;如果需要更好的寫(xiě)入性能,最大可以改為每500毫秒做一次sync。它的取值范圍是1 ~ 500毫秒,默認(rèn)值是100毫秒,不支持in-memory 存儲(chǔ)引擎。
總結(jié)
MongoDB 寫(xiě)入策略包括以下幾個(gè)方面:
- w:指定寫(xiě)入數(shù)據(jù)后需要在多少個(gè)節(jié)點(diǎn)上同步寫(xiě)入成功后,才返回確認(rèn)信息。
- j:設(shè)置 j:true 會(huì)將數(shù)據(jù)寫(xiě)入日志中,可以在節(jié)點(diǎn)宕機(jī)時(shí)恢復(fù)數(shù)據(jù)。但是 j:true 并不保證數(shù)據(jù)已經(jīng)寫(xiě)入磁盤(pán)文件中。
- wtimeout:指定寫(xiě)入超時(shí)時(shí)間。當(dāng)寫(xiě)入操作達(dá)到超時(shí)時(shí)間時(shí),即使最終成功寫(xiě)入也會(huì)返回錯(cuò)誤信息。
在實(shí)際使用中,可以根據(jù)具體的業(yè)務(wù)需求和系統(tǒng)環(huán)境來(lái)選擇適合的寫(xiě)入策略,以達(dá)到最佳的性能和可靠性。例如,在數(shù)據(jù)一致性要求高的場(chǎng)景中,可以使用 majority 寫(xiě)入確認(rèn)來(lái)保證數(shù)據(jù)同步的可靠性。而在性能要求高、數(shù)據(jù)不敏感的場(chǎng)景中,可以使用 w 值較小的寫(xiě)入關(guān)注點(diǎn)來(lái)提高寫(xiě)入性能。
本文轉(zhuǎn)載自微信公眾號(hào)「云數(shù)據(jù)庫(kù)技術(shù)」,可以通過(guò)以下二維碼關(guān)注。轉(zhuǎn)載本文請(qǐng)聯(lián)系云數(shù)據(jù)庫(kù)技術(shù)公眾號(hào)。