成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

如何避免系統預讀失效和緩存污染的問題?

網絡 網絡管理
只要我們提高進入到活躍 LRU 鏈表(或者 young 區域)的門檻,就能有效地保證活躍 LRU 鏈表(或者 young 區域)里的熱點數據不會被輕易替換掉。

面試中的兩個問題:

  1. 操作系統在讀磁盤的時候會額外多讀一些數據到內存中,最后也沒有用到,如何改善?
  2. 批量讀取數據的時候,可能會熱點數據擠出去,如何改善?

Linux 和 MySQL 的緩存

Linux 操作系統的緩存

在應用程序讀取文件的數據的時候,Linux 操作系統是會對讀取的文件數據進行緩存的,會緩存在文件系統中的 Page Cache(如下圖中的頁緩存)。

Page Cache 屬于內存空間里的數據,由于內存訪問比磁盤訪問快很多,在下一次訪問相同的數據就不需要通過磁盤 I/O 了,命中緩存就直接返回數據即可。

因此,Page Cache 起到了加速訪問數據的作用。

MySQL 的緩存

MySQL 的數據是存儲在磁盤里的,為了提升數據庫的讀寫性能,Innodb 存儲引擎設計了一個緩沖池(Buffer Pool),Buffer Pool 屬于內存空間里的數據。

有了緩沖池后:

  • 當讀取數據時,如果數據存在于 Buffer Pool 中,客戶端就會直接讀取 Buffer Pool 中的數據,否則再去磁盤中讀取。
  • 當修改數據時,首先是修改 Buffer Pool 中數據所在的頁,然后將其頁設置為臟頁,最后由后臺線程將臟頁寫入到磁盤。

傳統 LRU 是如何管理內存數據的?

Linux 的 Page Cache 和 MySQL 的 Buffer Pool 的大小是有限的,并不能無限的緩存數據,對于一些頻繁訪問的數據我們希望可以一直留在內存中,而一些很少訪問的數據希望可以在某些時機可以淘汰掉,從而保證內存不會因為滿了而導致無法再緩存新的數據,同時還能保證常用數據留在內存中。

要實現這個,最容易想到的就是 LRU(Least recently used)算法。

LRU 算法一般是用「鏈表」作為數據結構來實現的,鏈表頭部的數據是最近使用的,而鏈表末尾的數據是最久沒被使用的。那么,當空間不夠了,就淘汰最久沒被使用的節點,也就是鏈表末尾的數據,從而騰出內存空間。

因為 Linux 的 Page Cache 和 MySQL 的 Buffer Pool 緩存的基本數據單位都是頁(Page)單位,所以后續以「頁」名稱代替「數據」。

傳統的 LRU 算法的實現思路是這樣的:

  • 當訪問的頁在內存里,就直接把該頁對應的 LRU 鏈表節點移動到鏈表的頭部。
  • 當訪問的頁不在內存里,除了要把該頁放入到 LRU 鏈表的頭部,還要淘汰 LRU 鏈表末尾的頁。

存在的問題:

如果一條數據僅僅是突然被訪問(有可能后續將不再訪問),在 LRU 算法下,此數據將被定義為熱數據,最晚被淘汰。但實際生產環境下,我們很多時候需要計算的是一段時間下key的訪問頻率,淘汰此時間段內的冷數據。

預讀失效,怎么辦?

什么是預讀機制?

Linux 操作系統為基于 Page Cache 的讀緩存機制提供預讀機制,一個例子是:

  • 應用程序只想讀取磁盤上文件 A 的 offset 為 0-3KB 范圍內的數據,由于磁盤的基本讀寫單位為 block(4KB),于是操作系統至少會讀 0-4KB 的內容,這恰好可以在一個 page 中裝下。
  • 但是操作系統出于空間局部性原理(靠近當前被訪問數據的數據,在未來很大概率會被訪問到),會選擇將磁盤塊 offset [4KB,8KB)、[8KB,12KB) 以及 [12KB,16KB) 都加載到內存,于是額外在內存中申請了 3 個 page;

下圖代表了操作系統的預讀機制:

上圖中,應用程序利用 read 系統調動讀取 4KB 數據,實際上內核使用預讀機制(ReadaHead) 機制完成了 16KB 數據的讀取,也就是通過一次磁盤順序讀將多個 Page 數據裝入 Page Cache。

這樣下次讀取 4KB 數據后面的數據的時候,就不用從磁盤讀取了,直接在 Page Cache 即可命中數據。因此,預讀機制帶來的好處就是減少了 磁盤 I/O 次數,提高系統磁盤 I/O 吞吐量。

MySQL Innodb 存儲引擎的 Buffer Pool 也有類似的預讀機制,MySQL 從磁盤加載頁時,會提前把它相鄰的頁一并加載進來,目的是為了減少磁盤 IO。

預讀失效會帶來什么問題?

如果這些被提前加載進來的頁,并沒有被訪問,相當于這個預讀工作是白做了,這個就是預讀失效。

如果把「預讀頁」放到了 LRU 鏈表頭部,而當內存空間不夠的時候,還需要把末尾的頁淘汰掉。而末尾淘汰的頁,可能是熱點數據,這樣就大大降低了緩存命中率 。

如何避免預讀失效造成的影響?

我們不能因為害怕預讀失效,而將預讀機制去掉,大部分情況下,空間局部性原理還是成立的。要避免預讀失效帶來影響,可以從兩個方面考慮

  • 讓預讀頁停留在內存里的時間要盡可能的短,
  • 讓真正被訪問的頁移動到 LRU 鏈表的頭部,從而保證熱數據留在內存里的時間盡可能長。

那到底怎么才能避免呢?

Linux 操作系統和 MySQL Innodb 通過改進傳統 LRU 鏈表來避免預讀失效帶來的影響,具體的改進分別如下:

  • Linux 操作系統實現兩個了 LRU 鏈表:活躍 LRU 鏈表(active_list)和非活躍 LRU 鏈表(inactive_list);
  • MySQL 的 Innodb 存儲引擎是在一個 LRU 鏈表上劃分來 2 個區域:young 區域 和 old 區域。

這兩個改進方式,設計思想都是類似的,都是將數據分為了冷數據和熱數據,然后分別進行 LRU 算法。不再像傳統的 LRU 算法那樣,所有數據都只用一個 LRU 算法管理。

接下來,具體聊聊 Linux 和 MySQL 是如何避免預讀失效帶來的影響?

Linux 是如何避免預讀失效帶來的影響?

Linux 操作系統實現兩個了 LRU 鏈表:活躍 LRU 鏈表(active_list)和非活躍 LRU 鏈表(inactive_list)。

  • active list 活躍內存頁鏈表,這里存放的是最近被訪問過(活躍)的內存頁;
  • inactive list 不活躍內存頁鏈表,這里存放的是很少被訪問(非活躍)的內存頁;

有了這兩個 LRU 鏈表后,預讀頁就只需要加入到 inactive list 區域的頭部,當頁被真正訪問的時候,才將頁插入 active list 的頭部。如果預讀的頁一直沒有被訪問,就會從 inactive list 移除,這樣就不會影響 active list 中的熱點數據。

MySQL 是如何避免預讀失效帶來的影響?

MySQL 的 Innodb 存儲引擎是在一個 LRU 鏈表上劃分來 2 個區域,young 區域 和 old 區域。

young 區域在 LRU 鏈表的前半部分,old 區域則是在后半部分,這兩個區域都有各自的頭和尾節點,如下圖:

young 區域與 old 區域在 LRU 鏈表中的占比關系并不是一比一的關系,而是 63:37(默認比例)的關系。劃分這兩個區域后,預讀的頁就只需要加入到 old 區域的頭部,當頁被真正訪問的時候,才將頁插入 young 區域的頭部。如果預讀的頁一直沒有被訪問,就會從 old 區域移除,這樣就不會影響 young 區域中的熱點數據。

緩存污染,怎么辦?

什么是緩存污染?

雖然 Linux (實現兩個 LRU 鏈表)和 MySQL (劃分兩個區域)通過改進傳統的 LRU 數據結構,避免了預讀失效帶來的影響。

但是如果還是使用「只要數據被訪問一次,就將數據加入到活躍 LRU 鏈表頭部(或者 young 區域)」這種方式的話,那么還存在緩存污染的問題。

當我們在批量讀取數據的時候,由于數據被訪問了一次,這些大量數據都會被加入到「活躍 LRU 鏈表」里,然后之前緩存在活躍 LRU 鏈表(或者 young 區域)里的熱點數據全部都被淘汰了,如果這些大量的數據在很長一段時間都不會被訪問的話,那么整個活躍 LRU 鏈表(或者 young 區域)就被污染了。

緩存污染帶來的問題

緩存污染帶來的影響就是很致命的,等這些熱數據又被再次訪問的時候,由于緩存未命中,就會產生大量的磁盤 I/O,系統性能就會急劇下降。

怎么避免緩存污染造成的影響?

前面的 LRU 算法只要數據被訪問一次,就將數據加入活躍 LRU 鏈表(或者 young 區域),這種 LRU 算法進入活躍 LRU 鏈表的門檻太低了!正式因為門檻太低,才導致在發生緩存污染的時候,很容就將原本在活躍 LRU 鏈表里的熱點數據淘汰了。

所以,只要我們提高進入到活躍 LRU 鏈表(或者 young 區域)的門檻,就能有效地保證活躍 LRU 鏈表(或者 young 區域)里的熱點數據不會被輕易替換掉。

Linux 操作系統和 MySQL Innodb 存儲引擎分別是這樣提高門檻的:

  • Linux 操作系統:在內存頁被訪問第二次的時候,才將頁從 inactive list 升級到 active list 里。
  • MySQL Innodb:在內存頁被訪問第二次的時候,并不會馬上將該頁從 old 區域升級到 young 區域,因為還要進行停留在 old 區域的時間判斷:
  • 如果第二次的訪問時間與第一次訪問的時間在 1 秒內(默認值),那么該頁就不會被從 old 區域升級到 young 區域;
  • 如果第二次的訪問時間與第一次訪問的時間超過 1 秒,那么該頁就會從 old 區域升級到 young 區域;
責任編輯:武曉燕 來源: 今日頭條
相關推薦

2023-08-31 13:36:00

系統預讀失效

2021-08-05 16:10:03

進程緩存緩存服務Java

2024-07-17 08:00:00

MySQLDump緩存

2015-06-05 10:21:40

數據中心

2010-03-24 18:47:43

Nginx緩存

2012-12-17 14:54:55

算法緩存Java

2019-11-05 14:24:31

緩存雪崩框架

2017-07-13 16:40:16

偽共享緩存行存儲

2021-11-30 10:58:52

算法緩存技術

2015-08-26 16:26:19

SQL

2009-08-17 15:55:32

ASP.NET緩存

2021-12-25 22:28:27

緩存穿透緩存擊穿緩存雪崩

2022-10-08 00:04:00

緩存架構限流

2018-05-14 22:58:07

數據中心空氣污染運維管理

2010-06-01 15:40:07

數據庫網絡部署

2009-10-28 09:54:32

Linux內核詳細解析

2024-11-05 13:50:12

2018-04-10 13:02:51

HBase寫入流程數據

2021-03-02 09:45:07

java循環依賴開發技術

2020-03-03 09:43:21

軟件數據庫Java
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产清纯白嫩初高生在线播放视频 | 成人99 | 精品九九在线 | 亚洲一区二区 | 成人精品一区二区三区 | 日本成人午夜影院 | 午夜免费视频 | 99热视 | 久久国产精品一区二区三区 | 一级毛片视频 | 国产一区高清 | 五月激情综合 | 天堂av影院 | 亚洲激情在线视频 | 日本视频中文字幕 | 亚洲视频在线观看 | 国产在线二区 | 免费观看一区二区三区毛片 | 成人在线视频网 | 欧美一级三级在线观看 | 欧美xxxx色视频在线观看免费 | 久久久久99 | 亚洲一区二区精品视频 | 夜夜骑首页 | 国产精品久久久久久久久久久久久久 | 91精品久久久久久久久中文字幕 | 久久久久久女 | 久久国产精品首页 | 国产精品视频999 | 综合九九| 欧美一级电影免费观看 | 国产情侣啪啪 | 国产精品国产成人国产三级 | 欧美男人亚洲天堂 | 久久久婷| 日韩成人一区 | 免费视频一区二区 | 亚洲美女一区 | 二区av| 91精品国产欧美一区二区成人 | 啪一啪在线视频 |