成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

程序員修神之路--談了千百遍的緩存數據的一致性問題

存儲 存儲軟件
當我們的系統引入緩存組件之后,性能得到了大幅度提升,但是隨之而來的是代碼需要引入一定的復雜度,比如緩存的更新策略,寫入策略,過期策略等,而其中最可能導致程序員加班的莫過于緩存和數據庫的一致性問題了,既:緩存中的數據和數據庫中的數據不一致。

 

  •  保證緩存和數據庫的一致性很簡單嗎?
  • 有哪些方式能保證緩存和數據庫的一致性呢?
  • 如果發生了緩存和數據庫數據不一致的情況怎么辦呢?

當我們的系統引入緩存組件之后,性能得到了大幅度提升,但是隨之而來的是代碼需要引入一定的復雜度,比如緩存的更新策略,寫入策略,過期策略等,而其中最可能導致程序員加班的莫過于緩存和數據庫的一致性問題了,既:緩存中的數據和數據庫中的數據不一致。

一致性問題

說到一致性問題,這算是分布式系統中不可避免的一個痛點,或者說分布式系統天然就自帶了數據一致性問題,雖然可以利用很多分布式事務解決方案來做到一致性,但是實際的系統架構設計中,我還是推崇避免分布式事務。緩存和數據庫數據的一致性在產生原理上和分布式類似,其實可以把他們兩個的關系看做是分布式系統中的兩個操作節點。

凡是處于不同物理位置的兩個操作,如果操作的是相同數據,都會遇到一致性問題

產生數據一致性問題的根本原因是對一個數據的多個操作過程,緩存和數據庫數據的一致性也是這個原理,系統中最常見的操作流程是這樣的:

  • 數據的請求首先查詢緩存中是否存在該數據
  • 如果數據命中緩存(在緩存中存在)則直接返回數據,如果數據沒有命中緩存(緩存中不存在),則去數據庫中取數據
  • 從數據庫中取回數據,然后把數據寫入緩存

好圖

從圖中可以清楚的看到,對數據庫的操作和對緩存的操作是兩個不同階段的操作,在任何一個操作過程中都會發生線程安全問題。比如說:

  • 當兩個線程同時查詢緩存的時候,可能會發生兩個線程都沒有命中緩存的問題
  • 如果兩個線程都沒有命中緩存就會發生同時查詢數據庫的問題
  • 接著就會發生兩個線程同時回寫緩存的問題

而這還不是最致命的,畢竟兩個線程同時查詢數據庫,同時回寫緩存數據在多數情況下緩存數據和數據庫數據還能保持一致。最要命的是如果是兩個線程都進行更新操作,最常見的更新過程是先更新數據庫,然后更新緩存。下面就以最常見的用戶積分場景為例,每個用戶都有自己的積分,假如發生以下過程:

  • 線程A根據業務會把用戶id為1的積分更新成100
  • 線程B根據業務會把用戶id為1的積分更新成200
  • 在數據庫層面,線程A和線程B肯定不存在并發情況,因為數據庫用鎖來保證了ACID(假如是mysql等關系型數據庫),無論數據庫中最終的值是100還是200,我們都假設正確。
  • 假設線程B在A之后更新數據庫,則數據庫中的值為200
  • 線程A和線程B在回寫緩存過程中,很可能會發生線程A在線程B之后操作緩存的情況(因為網絡調用存在不確定性),這個時候緩存內的值會被更新成100,發生了緩存和數據庫不一致的情況

通過以上案例可見,解決緩存和數據庫數據不一致的根本解決方案是需要把兩個操作合并成邏輯上能保證事務的一個操作

兩個操作看做一個操作

分布式鎖

在平時開發中,利用分布式鎖可能算是比較常見的解決方案了。利用分布式鎖把緩存操作和數據庫操作封裝為邏輯上的一個操作可以保證數據的一致性,具體流程為:

  • 每個想要操作緩存和數據庫的線程都必須先申請分布式鎖
  • 如果成功獲得鎖,則進行數據庫和緩存操作,操作完畢釋放鎖
  • 如果沒有獲得鎖,根據不同業務可以選擇阻塞等待或者輪訓,或者直接返回的策略

image

利用分布式鎖是解決分布式事務的一種方案,但是在一定程度上會降低系統的性能,而且分布式鎖的設計要考慮到down機和死鎖的意外情況,而最常見的分布式鎖就是利用redis,但是也會有不少坑。

刪除緩存

相對于分布式鎖的方案,而程序員實際中最喜歡使用的還是刪除緩存的方式,在一個可能會發生不一致的場景下,我們會以數據庫為主,在操作完數據庫之后,不去更新緩存,而是刪除緩存。這在一定意義上相當于只操作數據庫,把需要維護的兩個數據源變成了一個數據源。

image

這種方式要求必須先操作數據庫,后操作緩存,不然的話發生不一致的幾率會大很多。為什么這么說呢?因為就算是先操作數據庫也會有發生不一致的幾率,但是畢竟在整個操作過程中,刪除緩存的操作只占整個流程時間的一小部分而已,而且我們可以利用緩存的過期時間來保證數據的最終一致性,所以在一些可以容忍數據短暫不一致的場景下可以采用這種方案的。

刪除緩存方案帶來的另外一個劣勢是:如果同樣的數據會被頻繁更新,緩存會被頻繁刪除,當有讀請求的時候又會被頻繁的從數據庫加載,所以這種方案適用于那種對緩存命中率不敏感的系統中。

單線程

發生緩存和數據庫不一致的原因在于多個線程的同時操作,如果相同的數據始終只會有一個線程去操作,不一致的情況就會避免了,比如nodejs,可以充分利用nodejs單線程的優勢。提到單線程不能不提一下Actor模型,actor模型在對于同樣的對象上可以看做是單線程模式。

單線程的模式基本上和分布式鎖的方案類似,只不過單線程不需要鎖就可以實現操作的順序化,這也是單線程的優勢所在。

其他方案

如果是以緩存為主呢?假如我們的應用程序只和緩存組件通信,至于持久化數據庫由專門的程序負責,這樣行不行呢?在理論上是可以的

image

  • 不過這種方案需要考慮幾個方面:
  • 數據從緩存持久化到數據采用什么樣的解決方案,是同步進行還是異步進行呢?
  • 在新數據請求的時候,如果緩存不存在,要采用什么樣的方式來填充數據

如果緩存模塊掛掉了該怎么辦?

以緩存為主的方案的優勢是數據優先進入IO速度快的設備,對于那些請求量大,但是可以容忍一定數據丟失的應用非常合適,比如應用log數據的收集系統,這種系統其中一個最大的特點就是可以容忍一定數據的丟失,但是并發的請求數會非常大。所以我們就可以利用緩存設備前置的方案來應對這種應用場景。

本文轉載自微信公眾號「架構師修行之路」,可以通過以下二維碼關注。轉載本文請聯系架構師修行之路公眾號。

 

責任編輯:武曉燕 來源: 架構師修行之路
相關推薦

2024-04-11 13:45:14

Redis數據庫緩存

2020-09-14 08:47:46

緩存程序員存儲

2022-09-06 15:30:20

緩存一致性

2024-11-14 07:10:00

2019-02-13 11:04:42

系統緩存軟件

2020-09-04 06:32:08

緩存數據庫接口

2016-11-29 09:00:19

分布式數據一致性CAS

2020-09-28 11:08:38

系統緩存架構

2023-04-13 08:15:47

Redis緩存一致性

2021-09-08 11:03:13

緩存數據庫性能

2012-09-24 09:35:42

分布式系統

2024-11-07 22:57:30

2019-11-26 09:24:19

程序員Kubernetes微服務

2020-09-07 07:36:32

數據庫集群程序員

2022-08-11 07:55:05

數據庫Mysql

2025-06-16 02:11:00

2022-12-14 08:23:30

2023-08-01 07:42:33

Redis數據項目

2022-09-16 09:46:42

緩存數據庫

2019-03-27 13:56:39

緩存雪崩穿透
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产一级一片免费播放 | 国产精品久久久久久久7电影 | 日日骚视频| 国产良家自拍 | 黑人一级黄色大片 | 国产精品综合一区二区 | 全部免费毛片在线播放网站 | 粉嫩在线 | 中文字幕第十页 | 天堂男人av | 亚洲一区二区三区高清 | 超碰一区二区 | 91视频免费观看 | 欧美综合国产精品久久丁香 | www.精品国产 | 久久久九九 | 日韩欧美一区二区三区免费观看 | 亚洲国产成人精品女人 | 在线欧美亚洲 | 欧美一区二区在线免费观看 | 涩涩视频在线观看免费 | 亚洲福利 | 日韩欧美在线播放 | 久久国产婷婷国产香蕉 | 久久久精品一区 | 欧美中文字幕 | 国产1区2区在线观看 | 天天操天天干天天爽 | 免费在线成人 | 日韩一区二区在线观看 | 色吊丝2| 免费午夜视频在线观看 | h在线免费观看 | 色婷婷久久 | 国产成人久久 | 亚洲国产精品一区二区三区 | 精品视频免费在线 | 福利在线观看 | 成人欧美一区二区三区黑人孕妇 | 免费v片 | 蜜桃视频在线观看免费视频网站www |