不知道這四種緩存模式,敢說懂緩存嗎?
概述
在系統架構中,緩存可謂提供系統性能的最簡單方法之一,稍微有點開發經驗的同學必然會與緩存打過交道,最起碼也實踐過。
如果使用得當,緩存可以減少響應時間、減少數據庫負載以及節省成本。但如果緩存使用不當,則可能出現一些莫名其妙的問題。
在不同的場景下,所使用的緩存策略也是有變化的。如果在你的印象和經驗中,緩存還只是簡單的查詢、更新操作,那么這篇文章真的值得你學習一下。
在這里,為大家系統地講解4種緩存模式以及它們的使用場景、流程以及優缺點。
緩存策略的選擇
本質上來講,緩存策略取決于數據和數據訪問模式。換句話說,數據是如何寫和讀的。
例如:
- 系統是寫多讀少的嗎?(例如,基于時間的日志)
- 數據是否是只寫入一次并被讀取多次?(例如,用戶配置文件)
- 返回的數據總是唯一的嗎?(例如,搜索查詢)
選擇正確的緩存策略才是提高性能的關鍵。
常用的緩存策略有以下五種:
- Cache-Aside Pattern:旁路緩存模式
- Read Through Cache Pattern:讀穿透模式
- Write Through Cache Pattern:寫穿透模式
- Write Behind Pattern:又叫Write Back,異步緩存寫入模式
上述緩存策略的劃分是基于對數據的讀寫流程來區分的,有的緩存策略下是應用程序僅和緩存交互,有的緩存策略下應用程序同時與緩存和數據庫進行交互。因為這個是策略劃分比較重要的一個維度,所以在后續流程學習時大家需要特別留意一下。
Cache Aside
Cache Aside是最常見的緩存模式,應用程序可直接與緩存和數據庫對話。Cache Aside可用來讀操作和寫操作。
讀操作的流程圖:
Cache Aside Pattern
讀操作的流程:
- 應用程序接收到數據查詢(讀)請求;
- 應用程序所需查詢的數據是否在緩存上:
如果存在(Cache hit),從緩存上查詢出數據,直接返回;
如果不存在(Cache miss),則從數據庫中檢索數據,并存入緩存中,返回結果數據;
這里我們需要留意一個操作的邊界,也就是數據庫和緩存的操作均由應用程序直接進行操作。
寫操作的流程圖:
Cache Aside Pattern
這里的寫操作,包括創建、更新和刪除。在寫操作的時候,Cache Aside模式是先更新數據庫(增、刪、改),然后直接刪除緩存。
Cache Aside模式可以說適用于大多數的場景,通常為了應對不同類型的數據,還可以有兩種策略來加載緩存:
- 使用時加載緩存:當需要使用緩存數據時,從數據庫中查詢出來,第一次查詢之后,后續請求從緩存中獲得數據;
- 預加載緩存:在項目啟動時或啟動后通過程序預加載緩存信息,比如”國家信息、貨幣信息、用戶信息,新聞信息“等不是經常變更的數據。
Cache Aside適用于讀多寫少的場景,比如用戶信息、新聞報道等,一旦寫入緩存,幾乎不會進行修改。該模式的缺點是可能會出現緩存和數據庫雙寫不一致的情況。
Cache Aside也是一個標準的模式,像Facebook便是采用的這種模式。
Read Through
Read-Through和Cache-Aside很相似,不同點在于程序不需要關注從哪里讀取數據(緩存還是數據庫),它只需要從緩存中讀數據。而緩存中的數據從哪里來是由緩存決定的。
Cache Aside是由調用方負責把數據加載入緩存,而Read Through則用緩存服務自己來加載,從而對應用方是透明的。Read-Through的優勢是讓程序代碼變得更簡潔。
這里就涉及到我們上面所說的應用程序操作邊界問題了,直接來看流程圖:
Read Through
在上述流程圖中,重點關注一下虛線框內的操作,這部分操作不再由應用程序來處理,而是由緩存自己來處理。也就是說,當應用從緩存中查詢某條數據時,如果數據不存在則由緩存來完成數據的加載,最后再由緩存返回數據結果給應用程序。
Write Through
在Cache Aside中,應用程序需要維護兩個數據存儲:一個緩存,一個數據庫。這對于應用程序來說,有一些繁瑣。
Write-Through模式下,所有的寫操作都經過緩存,每次向緩存中寫數據時,緩存會把數據持久化到對應的數據庫中去,且這兩個操作在一個事務中完成。因此,只有兩次都寫成功了才是最終寫成功了。壞處是有寫延遲,好處是保證了數據的一致性。
可以理解為,應用程序認為后端就是一個單一的存儲,而存儲自身維護自己的Cache。
因為程序只和緩存交互,編碼會變得更加簡單和整潔,當需要在多處復用相同邏輯時這點就變得格外明顯。
Write Through
當使用Write-Through時,一般都配合使用Read-Through來使用。Write-Through的潛在使用場景是銀行系統。
Write-Through適用情況有:
- 需要頻繁讀取相同數據
- 不能忍受數據丟失(相對Write-Behind而言)和數據不一致
在使用Write-Through時要特別注意的是緩存的有效性管理,否則會導致大量的緩存占用內存資源。甚至有效的緩存數據被無效的緩存數據給清除掉。
Write-Behind
Write-Behind和Write-Through在”程序只和緩存交互且只能通過緩存寫數據“這方面很相似。不同點在于Write-Through會把數據立即寫入數據庫中,而Write-Behind會在一段時間之后(或是被其他方式觸發)把數據一起寫入數據庫,這個異步寫操作是Write-Behind的最大特點。
數據庫寫操作可以用不同的方式完成,其中一個方式就是收集所有的寫操作并在某一時間點(比如數據庫負載低的時候)批量寫入。另一種方式就是合并幾個寫操作成為一個小批次操作,接著緩存收集寫操作一起批量寫入。
異步寫操作極大地降低了請求延遲并減輕了數據庫的負擔。同時也放大了數據不一致的。比如有人此時直接從數據庫中查詢數據,但是更新的數據還未被寫入數據庫,此時查詢到的數據就不是最新的數據。
小結
不同的緩存模式有不同的考量點和特征,根據應用程序需求場景的不同,需要靈活的選擇適配的緩存模式。在實踐的過程中往往也是多種模式相結合來使用。