Redis和MySQL如何保持數據一致性?
在高并發的場景下,大量的請求直接訪問Mysql很容易造成性能問題。所以,我們都會用Redis來做數據的緩存,削減對數據庫的請求。但是,Mysql和Redis是兩種不同的數據庫,如何保證不同數據庫之間數據的一致性就非常關鍵了。
一、導致數據不一致的原因
在高并發的業務場景下,數據庫大多數情況都是用戶并發訪問最薄弱的環節。
所以,就需要使用redis做一個緩沖操作,讓請求先訪問到redis,而不是直接訪問MySQL等數據庫。
讀取緩存步驟一般沒有什么問題,但是一旦涉及到數據更新:數據庫和緩存更新,就容易出現緩存(Redis)和數據庫(MySQL)間的數據一致性問題。
這個業務場景,主要是解決讀數據從Redis緩存,一般都是按照下圖的流程來進行業務操作。
二、緩存先后刪除問題
不管是先寫MySQL數據庫,再刪除Redis緩存;還是先刪除緩存,再寫庫,都有可能出現數據不一致的情況。
1. 先刪除緩存
如果先刪除Redis緩存數據,然而還沒有來得及寫入MySQL,另一個線程就來讀取
這個時候發現緩存為空,則去Mysql數據庫中讀取舊數據寫入緩存,此時緩存中為臟數據。
然后數據庫更新后發現Redis和Mysql出現了數據不一致的問題
2. 后刪除緩存
如果先寫了庫,然后再刪除緩存,不幸的寫庫的線程掛了,導致了緩存沒有刪除
這個時候就會直接讀取舊緩存,最終也導致了數據不一致情況
因為寫和讀是并發的,沒法保證順序,就會出現緩存和數據庫的數據不一致的問題
三、解決方案
1. 延時雙刪策略
(1) 基本思路:
在寫庫前后都進行redis.del(key)操作,并且設定合理的超時時間。
偽代碼如下:
public void write( String key, Object data ){ redis.delKey( key ); db.updateData( data ); Thread.sleep( 500 ); redis.delKey( key );}br
(2) 具體步驟:
- 先刪除緩存
- 再寫數據庫
- 休眠500毫秒
- 再次刪除緩存
問題:這個500毫秒怎么確定的,具體該休眠多久時間呢?
需要評估自己的項目的讀數據業務邏輯的耗時。
這么做的目的,就是確保讀請求結束,寫請求可以刪除讀請求造成的緩存臟數據。
當然這種策略還要考慮redis和數據庫主從同步的耗時。
最后的的寫數據的休眠時間:則在讀數據業務邏輯的耗時基礎上,加幾百ms即可。比如:休眠1秒。
(3) 設置緩存過期時間是關鍵點
從理論上來說,給緩存設置過期時間,是保證最終一致性的解決方案
所有的寫操作以數據庫為準,只要到達緩存過期時間,緩存刪除
如果后面還有讀請求的話,就會從數據庫中讀取新值然后回填緩存
(4) 方案缺點
結合雙刪策略+緩存超時設置,這樣最差的情況就是:
- 在緩存過期時間內發生數據存在不一致
- 同時又增加了寫請求的耗時。
2. 異步更新緩存(基于Mysql binlog的同步機制)
(1) 整體思路
a.涉及到更新的數據操作,利用Mysql binlog 進行增量訂閱消費
b.將消息發送到消息隊列
c.通過消息隊列消費將增量數據更新到Redis上
d.操作情況:
- 讀取Redis緩存:熱數據都在Redis上
- 寫Mysql:增刪改都是在Mysql進行操作
- 更新Redis數據:Mysql的數據操作都記錄到binlog,通過消息隊列及時更新到Redis上
(2) Redis更新過程
a.數據操作主要分為兩種:
- 一種是全量(將所有數據一次性寫入Redis)
- 一種是增量(實時更新)
這里說的是增量,指的是mysql的update、insert、delate變更數據。
b.讀取binlog后分析 ,利用消息隊列,推送更新各臺的redis緩存數據。
- 這樣一旦MySQL中產生了新的寫入、更新、刪除等操作,就可以把binlog相關的消息推送至Redis
- Redis再根據binlog中的記錄,對Redis進行更新
其實這種機制,很類似MySQL的主從備份機制,因為MySQL的主備也是通過binlog來實現的數據一致性
這里的消息推送工具你也可以采用別的第三方:kafka、rabbitMQ等來實現推送更新Redis!
總結
在高并發應用場景下,如果是對數據一致性要求高的情況下,要定位好導致數據和緩存不一致的原因。
解決高并發場景下數據一致性的方案有兩種,分別是延時雙刪策略和異步更新緩存兩種方案。
另外,設置緩存的過期時間是保證數據保持一致性的關鍵操作,需要結合業務進行合理的設置。