Redis Cluster 高可用原理說的頭頭是道,這些配置不懂就是紙上談兵
Redis Cluster 集群相關(guān)配置,使用集群方式的你必須重視和知曉。別嘴上原理說的頭頭是道,而集群有哪些配置?如何配置讓集群快到飛起,實(shí)現(xiàn)真正的高可用卻一頭霧水,通過下面這些配置詳解也讓你對集群原理更加深刻,告別技術(shù)懸浮。
關(guān)于 Redis Cluster 原理請點(diǎn)擊《Redis 高可用篇:Cluster 集群能支撐的數(shù)據(jù)有多大?》
cluster-enabled
普通的 Redis 實(shí)例是不能成為集群的一員,想要將該節(jié)點(diǎn)加入 Redis Cluster,需要設(shè)置 cluster-enabled yes
。
cluster-config-file
cluster-config-file nodes-6379.conf
指定集群中的每個節(jié)點(diǎn)文件。
集群中的每個節(jié)點(diǎn)都有一個配置文件,這個文件并不是讓程序員編輯的,是我自己創(chuàng)建和更新的,每個節(jié)點(diǎn)都要使用不同的配置文件,一定要確保同一個集群中的不同節(jié)點(diǎn)使用的是不同的文件。
cluster-node-timeout
設(shè)置集群節(jié)點(diǎn)不可用的最大超時時間,節(jié)點(diǎn)失效檢測。集群中當(dāng)一個節(jié)點(diǎn)向另一個節(jié)點(diǎn)發(fā)送PING命令,但是目標(biāo)節(jié)點(diǎn)未在給定的時限內(nèi)返回PING命令的回復(fù)時,那么發(fā)送命令的節(jié)點(diǎn)會將目標(biāo)節(jié)點(diǎn)標(biāo)記為PFAIL(possible failuer,可能已失效);
如果master 節(jié)點(diǎn)超過這個時間還是無響應(yīng),則用它的從節(jié)點(diǎn)將啟動故障遷移,升級成主節(jié)點(diǎn)。
注意,任何一個節(jié)點(diǎn)在這個時間之內(nèi)如果還是沒有連上大部分的主節(jié)點(diǎn),則此節(jié)點(diǎn)將停止接收任何請求。
默認(rèn)配置是 cluster-node-timeout 15000
,單位是毫秒數(shù)。
cluster-port
該端口是集群總線監(jiān)聽 TCP 連接的端口,默認(rèn)配置為 cluster-port 0
,我就會把端口綁定為客戶端命令端口 + 10000(客戶端端口默認(rèn) 6379,所以綁定為 16379 作為集群總線端口)。每個 Redis Cluster 節(jié)點(diǎn)都需要開放兩個端口:
- 一個用于服務(wù)于客戶端的 TCP 端口,比如 6379.
- 另一個稱為集群總線端口,節(jié)點(diǎn)使用集群總線進(jìn)行故障監(jiān)測、配置更新、故障轉(zhuǎn)移等。客戶端不要與集群總線端口通信,另外請確保在防火墻打開這兩個端口,否則 Redis 集群接地那將無法通信。
cluster-replica-validity-factor
該配置用于決定當(dāng) Redis Cluster 集群中,一個 master 宕機(jī)后,如何選擇一個 slave 節(jié)點(diǎn)完成故障轉(zhuǎn)移自動恢復(fù)(failover)。如果設(shè)置為 0 ,則不管 slave 與 master 之間斷開多久,都認(rèn)為自己有資格成為 master。
下面提供了兩種方式來評估 slave 的數(shù)據(jù)是否太舊。
- 如果有多個 slave 可以 failover,他們之間會通過交換信息選出擁有擁有最大復(fù)制 offset 的 slave 節(jié)點(diǎn)。
- 每個 slave 節(jié)點(diǎn)計算上次與 master 節(jié)點(diǎn)交互的時間,這個交互包含最后一次
ping
操作、master 節(jié)點(diǎn)傳輸過來的寫指令、上次可 master 斷開的時間等。如果上次交互的時間過去很久,那么這個節(jié)點(diǎn)就不會發(fā)起 failover。
針對第二點(diǎn),交互時間可以通過配置定義,如果 slave 與 master 上次交互的時間大于 (node-timeout * cluster-replica-validity-factor) + repl-ping-replica-period
,該 slave 就不會發(fā)生 failover。
例如,``node-timeout = 30 秒,
cluster-replica-validity-factor=10,
repl-ping-slave-period=10`秒, 表示slave節(jié)點(diǎn)與master節(jié)點(diǎn)上次交互時間已經(jīng)過去了310秒,那么slave節(jié)點(diǎn)就不會做failover。
調(diào)大 cluster-replica-validity-factor
則允許存儲過舊數(shù)據(jù)的 slave 節(jié)點(diǎn)提升為 master,調(diào)小的話可能會導(dǎo)致沒有 slave 節(jié)點(diǎn)可以升為 master 節(jié)點(diǎn)。
考慮高可用,建議大家設(shè)置為 cluster-replica-validity-factor 0
。
cluster-migration-barrier
沒有 slave 節(jié)點(diǎn)的 master 節(jié)點(diǎn)稱為孤兒 master節(jié)點(diǎn),這個配置就是用于防止出現(xiàn)裸奔的 master。
當(dāng)某個 master 的 slave 節(jié)點(diǎn)宕機(jī)后,集群會從其他 master 中選出一個富余的 slave 節(jié)點(diǎn)遷移過來,確保每個 master 節(jié)點(diǎn)至少有一個 slave 節(jié)點(diǎn),防止當(dāng)孤立 master 節(jié)點(diǎn)宕機(jī)時,沒有slave節(jié)點(diǎn)可以升為 master 導(dǎo)致集群不可用。
默認(rèn)配置為 cluster-migration-barrier 1
,是一個遷移臨界值。
含義是:遷移后 master 節(jié)點(diǎn)至少還有 1 個 slave 節(jié)點(diǎn)才能做遷移操作。比如 master A 節(jié)點(diǎn)有2個以上 slave 節(jié)點(diǎn) ,當(dāng)集群出現(xiàn)孤兒 master B 節(jié)點(diǎn)時,A 節(jié)點(diǎn)富余的 slave 節(jié)點(diǎn)可以遷移到 master B 節(jié)點(diǎn)上。
生產(chǎn)環(huán)境建議維持默認(rèn)值,最大可能保證高可用,設(shè)置為非常大的值或者配置 cluster-allow-replica-migration no
禁用自動遷移功能。
cluster-allow-replica-migration
默認(rèn)配置為 yes,表示允許自動遷移。
cluster-require-full-coverage
默認(rèn)配置是 yes
,表示為當(dāng) redis cluster 發(fā)現(xiàn)至少還有一個 哈希槽沒有被分配時禁止查詢操作。
這就會導(dǎo)致集群部分宕機(jī),整個集群就不可用了,當(dāng)所有哈希槽都有分配,集群會自動變?yōu)榭捎脿顟B(tài)。
如果你希望 cluster 的子集依然可用,配置成 cluster-require-full-coverage yes
。
cluster-replica-no-failover
默認(rèn)配置為 no
,當(dāng)配置成 yes
,在master 宕機(jī)時,slave 不會做故障轉(zhuǎn)移升為 master。
這個配置在多數(shù)據(jù)中心的情況下會很有用,你可能希望某個數(shù)據(jù)中心永遠(yuǎn)不要升級為 master 節(jié)點(diǎn),否則 master 節(jié)點(diǎn)就漂移到其他數(shù)據(jù)中心了。
cluster-allow-reads-when-down
默認(rèn)是 no
,表示當(dāng)集群因主節(jié)點(diǎn)數(shù)量達(dá)不到最小值或者哈希槽沒有完全分配而被標(biāo)記為失效時,節(jié)點(diǎn)將停止所有客戶端請求。
設(shè)置成 yes
,則允許集群失效的情況下依然可從節(jié)點(diǎn)中讀取數(shù)據(jù),保證了高可用。
cluster-allow-pubsubshard-when-down
配置成 yes
,表示當(dāng)集群因主節(jié)點(diǎn)數(shù)量達(dá)不到最小值或者哈希槽沒有完全分配而被標(biāo)記為失效時,pub/sub 依然可以正常運(yùn)行。
cluster-link-sendbuf-limit
設(shè)置每個集群總線連接的發(fā)送字節(jié)緩沖區(qū)的內(nèi)存使用限制,超過限制緩沖區(qū)將被清空(主要為了防止發(fā)送緩沖區(qū)發(fā)送給慢速連接時無限延長時間的問題)。
默認(rèn)禁用,建議最小設(shè)置1gb,這樣默認(rèn)情況下集群連接緩沖區(qū)可以容納至少一pubsub消息(client-query-buffer-limit 默認(rèn)是1gb)。