MySQL 能不能雙主?有沒有一致性問題?
MySQL能不能使用雙主架構?
可以。
MySQL為什么要使用雙主架構?
MySQL最常見的集群架構,是一主多從,主從同步,讀寫分離,但此時寫庫仍然是單點。
為了保證MySQL寫庫的高可用,可以在一個MySQL數據庫集群中可以設置兩個主庫,并設置雙向同步,以冗余寫庫的方式,來保證寫庫的高可用。
MySQL雙主架構,會存在什么問題?
如果MySQL雙主架構,同時提供服務,可能會引發數據的一致性問題。因為數據的同步有一個時間差,并發的寫入可能導致數據同步失敗,引起數據丟失。
舉個栗子:
如上圖所述,假設主庫使用了auto increment來作為自增主鍵:
- 兩個MySQL主庫設置雙向同步來保證主庫的高可用;
- 數據庫中現存的記錄主鍵是1,2,3;
- 主庫1插入了一條記錄,主鍵為4,并向主庫2同步數據;
- 數據同步成功之前,主庫2也插入了一條記錄,由于數據還沒有同步成功,插入記錄生成的主鍵也為4,并向主庫1也同步數據;
- 主庫1和主庫2都插入了主鍵為4的記錄,雙主同步失敗,數據不一致;
能否在MySQL層面,保證兩個主庫生成的主鍵一定不沖突呢?
可以的,只需要為兩個主庫的自增ID:
- 設置不同的初始值;
- 設置相同的增長步長;
如上圖所示:
- 兩個MySQL主庫設置雙向同步來保證主庫的高可用;
- 庫1的自增初始值是1,庫2的自增初始值是2,增長步長都為2;
- 庫1中插入數據主鍵為1/3/5/7,庫2中插入數據主鍵為2/4/6/8,不沖突;
- 數據雙向同步后,兩個主庫會包含全部數據;
如上圖所示,兩個主庫最終都將包含1/2/3/4/5/6/7/8所有數據,即使有一個主庫掛了,另一個主庫也能夠保證寫庫的高可用。
上述方案,依賴與數據庫的配置,能不能由應用程序,來保證數據的一致性呢?
答案是肯定的,應用程序使用統一的ID生成器,可以保證ID的生成不沖突。
如上圖所示,調用方插入數據時,帶入全局唯一ID,而不依賴于數據庫的auto increment,也能解決這個問題。
引發不一致的根本原因,是保證高可用的兩個主庫都對外提供服務,如果只有一個主庫對外提供服務,另一個主庫平時不提供服務,僅僅在主庫掛了的時候提供服務,能否消除上述數據不一致呢?
答案是悲觀的,仍然不行。
使用虛IP+keepalived的方式保證數據庫主庫的高可用,平時只有一臺主庫提供服務,也可能出現數據不一致。
如上圖所示:
- 兩個MySQL主庫設置雙向同步來保證主庫的高可用;
- 只有主庫1對外提供寫入服務;
- 兩個主庫設置相同的虛IP,在主庫1掛掉或者網絡異常的時候,虛IP自動漂移,備用主庫頂上,保證主庫的高可用;
切換過程中,由于虛IP沒有變化,所以切換過程對調用方是透明的,但在極限的情況下,仍可能引發數據不一致。
如上圖所示:
- 兩個MySQL主庫設置雙向同步,來保證主庫的高可用,并設置了相同的虛IP;
- 網絡抖動前,主庫1對上游提供寫入服務,插入了一條記錄,主鍵為4,并向備用主庫2同步數據;
- 突然主庫1網絡異常,keepalived檢測出異常后,實施虛IP漂移,備用主庫2開始提供服務;
- 在主鍵4的數據同步成功之前,主庫2插入了一條記錄,也生成了主鍵為4的記錄,結果導致數據不一致;
有沒有辦法緩解上述問題呢?
虛IP漂移,雙主同步延時導致的數據不一致,本質上,需要在雙主同步完數據之后,再實施虛IP偏移。
使用內網DNS探測,緩解上述問題:
- 使用內網域名連接數據庫,例如:db.kg.org;
- 主庫1和主庫2設置雙主同步,不使用相同虛IP,而是分別使用ip1和ip2;
- 一開始db.kg.org指向ip1;
- 用一個小腳本輪詢探測ip1主庫的連通性;
- 當ip1主庫發生異常時,腳本delay一個x秒的延時,等待主庫2同步完數據之后,再將db.kg.org解析到ip2;
- 應用程序以內網域名進行重連,即可自動連接到ip2主庫,并保證了數據的一致性;
畫外音:本質上,這是一個可用性與一致性的折衷。
總結
MySQL主庫高可用,主庫一致性,一些小技巧:
- 雙主同步是一種常見的保證寫庫高可用的方式;
- 設置相同步長,不同初始值,可以避免auto increment生成沖突主鍵;
- 不依賴數據庫,業務調用方自己生成全局唯一ID是一個好方法;
- 雙主保證寫庫高可用,只有一個寫庫提供服務,并不能完全保證一致性;
- 內網DNS探測,可以實現在主庫1出現問題后,延時一個時間,再進行主庫切換,以保證數據一致性,但犧牲了幾秒鐘的高可用;
知其然,知其所以然。
思路比結論更重要。