硬盤太慢！內存太慢！網絡太慢！全靠我來拯救！

作者：劉欣 2020-01-08 10:47:51

存儲存儲軟件

俗話說，計算機編程的任何問題，都可以通過增加一個抽象層來解決，這句話用在我身上就太合適了。

[[312192]]

俗話說，計算機編程的任何問題，都可以通過增加一個抽象層來解決，這句話用在我身上就太合適了。

我是緩存(Cache)，今天我給大家聊聊我這個抽象層是怎么工作的。

提到我的名字，你可能立刻會想到到Redis，因為它實在是太普及了，但是如果你只想到Redis，那視野未必有點狹窄，Redis僅僅是我在應用層小試牛刀而已。

Wikipedia上說我是一種用來保存數據的硬件或者軟件，這樣以后的訪問請求就可以更快地返回。

這個定義還真是挺抽象的，抽象的東西讓人感覺不好理解，我得給大家舉幾個例子。

為了突出我的位置，在下面的圖片中，緩存都用藍色來表示。

首先來看大家日常使用很多，但是又不太在意的瀏覽器緩存。

瀏覽器緩存

瀏覽器面對的問題是網絡訪問的速度遠遠低于本地訪問的速度，每次都訪問網絡開銷太大。

于是它就請我增加了一個中間層：開辟“緩存”區域，緩存JS, HTML, CSS，圖片等各種文件。

當然，瀏覽器這家伙也不能亂來，得遵循一定的規則來判斷什么時候用緩存中的文件，什么時候不辭辛苦地去訪問服務器的新文件。

這其中的關鍵點就是HTTP協議：

在服務器發給瀏覽器的響應中，有expires, max-age, last-modified, Etag等Header，粗略來說，expires 和 max-age 定義了一個資源的過期時間， last-modified和Etag用來檢查一個資源在服務器端有沒有變化。

對于它們的含義和詳細用法，網上資料多如牛毛，我這里就不再展開了。

我覺得有趣的事情是這些：

1. 當你在地址欄中輸入網址，按回車以后瀏覽器會使用Expires，max-age來查看本地緩存的內容是否失效，如果沒有，就直接使用

2. 當你按F5或者按瀏覽器刷新按鈕的時候瀏覽器不再考慮Expires，max-age，而是把Last-Modified / ETag 發到服務器去，問問服務器，這個文件有更新沒有?如果沒有，那就用本地緩存的文件，如果有更新，用服務器端最新的。

3. 當你用Ctrl + F5強制刷新的時候不使用任何緩存，向服務器發出全新請求。

CDN

說起CDN，可能很多人都意識不到它的存在，這也難怪，它對于大家來說幾乎是透明的，魔法發生在DNS的域名解析的過程。

但是CDN也是不折不扣的緩存。由于網絡情況復雜，如果客戶端離服務器比較遠，網速慢，體驗會很差;海量的用戶給后端服務器帶來巨大壓力，所以CDN就采用了就近訪問的方案：

把后端服務器的數據數據復制多份，挪到離客戶端比較近的“邊緣”服務器中，就近訪問，不但減少了訪問的時間，還大大降低了 “中央”服務器的負載。

瀏覽器緩存和CDN是配合使用的，瀏覽器的本地緩存失效以后，就需要向后端服務器來獲取了，但是如果一個系統有CDN，那瀏覽器還可以就近訪問CDN。

Linux Page Cache

在操作系統的世界中，時間是按納秒，微秒為單位的，雖然內存和硬盤都在同一臺機器中，沒有網絡開銷，但是硬盤實在是太慢，比內存慢幾萬倍，內存等不及。

所以Linux也增加了一個抽象層：Page cache ，把慢如蝸牛的硬盤的文件緩存在其中。

有了這個抽象層，在Linux當中，幾乎所有的文件讀寫操作都依賴Page Cache，在向硬盤寫入文件的時候，并不是直接把文件內容寫入硬盤以后才返回的，而是寫入到內核的Page Cache就直接返回了。

這個Page Cache會被標記為“Dirty”，隨后由內核線程寫入硬盤(也可以通過手工用sync命令寫入)。

各位看官可以想想，如果Page cache 的數據還沒有寫入硬盤，就斷電了，會發生什么事情? 該怎么處理?

當從硬盤讀取文件時，也不是直接把數據從硬盤復制到用戶態的內存，而是先復制到內核的Page Cache ，然后再復制到用戶態的內存。

正是由于這樣復制來復制去，在多個進程中間進行數據傳輸很麻煩，例如(一個進程讀取文件，然后通過Socket發送) ，所以后來就出現了零復制技術。

應用程序緩存

終于來到了大家熟悉的應用程序緩存，這個就不用我多說了，因為數據庫訪問速度慢，無法應對大量的并發訪問，所以增加一個緩存中間層，把熱點數據從數據庫中取出，放到可以快速訪問的內存當中。

大名鼎鼎的Redis干的就是這個活。

可是應用程序的緩存也是個雙刃劍，提升了訪問的效率，但是帶來了很多復雜性：

1. 代碼變復雜

2. 需要處理緩存和數據庫之間的數據一致性的問題

3. 處理緩存的穿透，雪崩等問題

4. 應用程序緩存現在已經變成了分布式的集群形式，數據的管理越來越麻煩。

CPU緩存

前面剛說到內存比硬盤快幾萬倍，可是在CPU面前，內存也只能屈居下風，CPU比內存快100多倍，數據和指令必須從內存加載到CPU才能執行，這次輪到CPU等不及了。

那就在CPU內增加緩存中間層，不過這次必須用硬件來實現。

CPU的緩存包括L1，L2, L3這三級Cache，把最熱點的數據和指令放入到其中。

我猜CPU Cache可能是最“底層”的Cache了。

在L1 Cache 最靠近CPU，速度最快，可以分為指令Cache (CPU要執行的指令)和數據Cache(指令要操作的數據)。

CPU Cache 和上面提到的各種Cache比起來，小得可憐，也就是幾百K到幾M。所以這些Cache要想發揮真正的作用，必須得依賴上帝的規矩局部性原理：

(1) 時間局部性：如果程序中的某條指令一旦執行，則不久之后該指令可能再次被執行;如果某數據被訪問，則不久之后該數據可能再次被訪問。

(2) 空間局部性：指一旦程序訪問了某個存儲單元，則不久之后。其附近的存儲單元也將被訪問。

最后總結一下放置在我這里的數據的特點，大家可以感受下：

(1)對數據的讀操作遠大于寫操作

(2)數據可能是之前的計算結果(計算過程比較耗時)

(3)數據是某個(速度較慢的)數據源的數據備份。

(4)數據訪問遵循上帝的規矩“局部性原理”

如果你在工作中也遇到了問題，不妨考慮一下，看看能不能用我來解決問題：增加一個中間層，用空間來換取時間。

【本文為51CTO專欄作者“劉欣”的原創稿件，轉載請通過作者微信公眾號coderising獲取授權】

戳這里，看該作者更多好文

責任編輯：武曉燕來源： 51CTO專欄

硬盤內存網絡

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

硬盤太慢！內存太慢！網絡太慢！全靠我來拯救！