成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

CMU15445 數(shù)據(jù)庫系統(tǒng)實(shí)驗(yàn)一:Buffer Pool Manager

運(yùn)維 數(shù)據(jù)庫運(yùn)維
本篇是實(shí)驗(yàn)一,管理文件系統(tǒng)的頁在內(nèi)存中的緩存 —— buffer pool manager。實(shí)驗(yàn)的目標(biāo)系統(tǒng) BusTub 是一個(gè)面向磁盤的 DBMS,但磁盤上的數(shù)據(jù)不支持字節(jié)粒度的訪問。

[[382283]]

本文轉(zhuǎn)載自微信公眾號「分布式點(diǎn)滴」,作者穆尼奧。轉(zhuǎn)載本文請聯(lián)系分布式點(diǎn)滴公眾號。  

本篇是實(shí)驗(yàn)一,管理文件系統(tǒng)的頁在內(nèi)存中的緩存 —— buffer pool manager。

概覽

實(shí)驗(yàn)的目標(biāo)系統(tǒng) BusTub 是一個(gè)面向磁盤的 DBMS,但磁盤上的數(shù)據(jù)不支持字節(jié)粒度的訪問。這就需要一個(gè)管理頁的中間層,但 Andy Pavlo 教授堅(jiān)持不使用 mmap 將頁管理權(quán)力讓渡給操作系統(tǒng),因此實(shí)驗(yàn)一 的目標(biāo)便在于主動管理磁盤中的頁(page)在內(nèi)存中的緩存,從而,最小化磁盤訪問次數(shù)(時(shí)間上)、最大化相關(guān)數(shù)據(jù)連續(xù)(空間上)。

該實(shí)驗(yàn)可以分解為相對獨(dú)立的兩個(gè)子任務(wù):

  • 維護(hù)替換策略的:LRU replacement policy
  • 管理緩沖池的:buffer pool manager

兩個(gè)組件都要求線程安全。

本文首先從基本概念、核心數(shù)據(jù)流總體分析下實(shí)驗(yàn)內(nèi)容,然后分別對兩個(gè)子任務(wù)進(jìn)行梳理。

作者:青藤木鳥 https://www.qtmuniao.com/2021/02/10/cmu15445-project1-buffer-pool/, 轉(zhuǎn)載請注明出處

實(shí)驗(yàn)分析

剛開始寫實(shí)驗(yàn)代碼的時(shí)候,感覺細(xì)節(jié)很多,實(shí)現(xiàn)時(shí)很容易丟三落四。但隨著實(shí)現(xiàn)和思考的深入,漸漸摸清了全貌,發(fā)現(xiàn)只要明確幾個(gè)基本概念和核心數(shù)據(jù)流,便能夠提綱挈領(lǐng)。

基本概念

buffer pool 的操作的基本單位為一段邏輯連續(xù)的字節(jié)數(shù)組,在磁盤上表現(xiàn)為頁(page),有唯一的標(biāo)識 page_id;在內(nèi)存中表現(xiàn)為幀(frame),有唯一的標(biāo)識 frame_id。為了記下哪些 frame 存的哪些 page,需要使用一個(gè)頁表(page table)。

下邊行文可能會混用 page 和 frame,因?yàn)檫@兩個(gè)概念都是 buffer pool 管理數(shù)據(jù)的基本單位,一般為 4k,其區(qū)別如下:

page id 是這一段單位數(shù)據(jù)的全局標(biāo)識,而 frame id 只是在內(nèi)存池(frame 數(shù)組)中索引某個(gè) page 下標(biāo)

page 在文件系統(tǒng)中是一段邏輯連續(xù)的字節(jié)數(shù)組;在內(nèi)存中,我們會給其附加一些元信息:pin_count_,is_dirty_


 

 

基本概念

而管理幀的內(nèi)存池大小一般來說是遠(yuǎn)小于磁盤的,因此在內(nèi)存池滿了后,再從磁盤加載新的頁到內(nèi)存池,需要 某種替換策略(replacer)將一些不再使用的頁踢出內(nèi)存池以騰出空間。

核心數(shù)據(jù)流

先說結(jié)論,buffer pool manager 的實(shí)現(xiàn)核心,在于對內(nèi)存池中所有 frame 的狀態(tài)的管理。因此,如果我們能梳理出 frame 的狀態(tài)機(jī),便可以把握好核心數(shù)據(jù)流。

buffer pool 維護(hù)了一個(gè) frame 數(shù)組,每個(gè) frame 有三種狀態(tài):

  1. free:初始狀態(tài),沒有存放任何 page
  2. pinned:存放了 thread 正在使用的 page
  3. unpinned:存放了 page,但 page 已經(jīng)不再為任何 thread 所使用

而待實(shí)現(xiàn)函數(shù):

  1. FetchPageImpl(page_id) 
  2. NewPageImpl(page_id) 
  3. UnpinPageImpl(page_id, is_dirty) 
  4. DeletePageImpl(page_id) 

便是驅(qū)動狀態(tài)機(jī)中上述狀態(tài)發(fā)生改變的動作(action),狀態(tài)機(jī)如下:


 

 

frame 狀態(tài)機(jī)

對應(yīng)到實(shí)現(xiàn)時(shí)數(shù)據(jù)結(jié)構(gòu)上:

  1. 保存 page 數(shù)據(jù)的 frame 數(shù)組為 pages_
  2. 所有 free frame 的索引(frame_id)保存在 free_list_ 中
  3. 所有 unpinned frame 的索引保存在 replacer_ 中
  4. 所有 pinned frame 索引和 unpinned frame 的索引保存在 page_table_ 中,并通過 page 中 pin_count_ 字段來區(qū)分兩個(gè)狀態(tài)。

上圖中,NewPage1 和 NewPage2 表示在 NewPage 函數(shù)中,每次獲取空閑 frame 時(shí),會先去空閑列表(freelist_)中取一個(gè) free frame,如果取不到,才會去 replacer_ 中驅(qū)逐一個(gè) unpinned 的 frame 后使用。這體現(xiàn)了 buffer pool manager 實(shí)現(xiàn)的一個(gè)目標(biāo):最小化磁盤訪問,原因后面分析。

實(shí)驗(yàn)組件

把握了本實(shí)驗(yàn)的基本概念和核心數(shù)據(jù)流后,再來分析兩個(gè)子任務(wù)。

TASK #1 - LRU REPLACEMENT POLICY

以前在 LeetCode 上寫過相關(guān)實(shí)現(xiàn),因此很自然的帶入之前經(jīng)驗(yàn),但隨后發(fā)現(xiàn)這兩個(gè)接口有一些不同。

LeetCode 上提供的是 kv store 接口,在 get/set 的時(shí)候完成新老順序的維護(hù),并在內(nèi)存池滿后自動替換最老的 KV。

但本實(shí)驗(yàn)提供的是 replacer 接口,維護(hù)一個(gè) unpinned 的 frame_id 列表 ,在調(diào)用 Unpin 時(shí)將 frame_id 加入列表并維護(hù)新老順序、在調(diào)用 Pin 時(shí)將 frame_id 從列表中摘除、在調(diào)用Victim 的時(shí)候?qū)⒆罾系?frame_id 返回。

當(dāng)然,本質(zhì)上還是一樣,因此本實(shí)驗(yàn)我也是采用 unordered_map 和 doubly linked list 的數(shù)據(jù)結(jié)構(gòu),實(shí)現(xiàn)細(xì)節(jié)不再贅述。需要注意的是,如果 Unpin 時(shí)發(fā)現(xiàn) frame_id 已經(jīng)在 replacer 中,則直接返回,并不改變列表的新老順序。因?yàn)檫壿嬌蟻碚f,同一個(gè) frame_id,并不能被 Unpin多次,因此我們只需要考慮 frame_id 第一次 Unpin。

放到更大的語境中,本質(zhì)上,replacer 就是一個(gè)維護(hù)了回收順序的回收站,即我們將所有 pin_count_ = 0 的 page 不直接從內(nèi)存中刪除,而是放入回收站中。根據(jù)數(shù)據(jù)訪問的時(shí)間局部性原理,剛剛被訪問的 page 很可能再次被訪問,因此當(dāng)我們不得不從回收站中真刪(Victim)一個(gè) frame 時(shí),需要?jiǎng)h最老的 frame。當(dāng)之后我們想訪問一個(gè)剛加入回收站的數(shù)據(jù)時(shí), 只需要將 page 從這個(gè)回收站中撈出來,從而省去一次磁盤訪問,這也就達(dá)到了最小化磁盤訪問的目標(biāo)。

TASK #2 - BUFFER POOL MANAGER

在實(shí)驗(yàn)分析部分已經(jīng)把核心邏輯說的差不多了,這里簡單羅列一下我實(shí)現(xiàn)中遇到的問題。

page_table_ 的范圍。在最初實(shí)現(xiàn)時(shí),畫出 frame 的狀態(tài)機(jī)之后,感覺 page_table_ 中只放 pinned frame id 很完美:可以使 frame id 按狀態(tài)互斥的分布在 free_list_ 、 replacer_ 和 page_table_ 中。但后來發(fā)現(xiàn),如果不將 unpinned frame id 保存在 page_table_ 中,就不能很好地復(fù)用 pin_count_ = 0 的 page 了,replacer 也就沒有了意義。

dirty page 的刷盤時(shí)機(jī)。有兩種策略,一種是每次 Unpin 的時(shí)候都刷,這樣會刷比較頻繁,但能保證異常掉電重啟后內(nèi)容不丟;一種是在 replacer victimized 的時(shí)候 lazily 的刷,這樣能保證刷的次數(shù)最少。這是性能和可靠性取舍,僅考慮本實(shí)驗(yàn),兩者肯定都能過。

NewPage 不要讀盤。這個(gè)就是我寫的 bug 了,畢竟 NewPage 的時(shí)候,磁盤上根本沒有對應(yīng) page 的內(nèi)容,因此會報(bào)如下錯(cuò)誤:

  1. 2021-02-18 16:53:47 [autograder/bustub/src/storage/disk/disk_manager.cpp:121:ReadPage] DEBUG - Read less than a page 
  2. 2021-02-18 16:53:47 [autograder/bustub/src/storage/disk/disk_manager.cpp:108:ReadPage] DEBUG - I/O error reading past end of file 

復(fù)用 frame 時(shí)清空元信息。在復(fù)用一個(gè)從 replacer 中驅(qū)逐的 frame 時(shí)尤其要注意,使用前一定要將 pin_count_\is_dirty_ 這些字段清空。當(dāng)然,在 DeletePage 的時(shí)候,也需要注意將 page_id_ 置為 INVALID_PAGE_ID 、清空上述字段。否則,再次使用時(shí), 如果 pin_count_ 在 Unpin 后,數(shù)值不為 0,會導(dǎo)致 DeletePage 時(shí)刪不掉該 page。

鎖的粒度。最粗暴的就是每個(gè)函數(shù)范圍粒度加鎖即可,后期如果需要優(yōu)化,再將鎖的粒度變細(xì)。

實(shí)驗(yàn)代碼

以 FetchPageImpl 為例強(qiáng)調(diào)下一些實(shí)現(xiàn)的細(xì)節(jié),注意到,實(shí)驗(yàn)已經(jīng)通過注釋給出了實(shí)現(xiàn)框架。

我使用中文注釋注出了一些我認(rèn)為需要注意的點(diǎn)。

  1. Page *BufferPoolManager::FetchPageImpl(page_id_t page_id) { 
  2.   // a. 使用自動獲取和釋放鎖 
  3.   std::scoped_lock<std::mutex> lock(latch_); 
  4.    
  5.   // 1.     Search the page table for the requested page (P). 
  6.   // 1.1    If P exists, pin it and return it immediately. 
  7.   auto target = page_table_.find(page_id); // b. 判斷存在與訪問數(shù)據(jù)只用一次查找 
  8.   if (target != page_table_.end()) { 
  9.     frame_id_t frame_id = target->second
  10.     // c. 通過指針運(yùn)算獲取 frame_id 處存放的 Page 結(jié)構(gòu)體 
  11.     Page *p = pages_ + frame_id;  
  12.     p->pin_count_++; 
  13.     replacer_->Pin(frame_id); // d. 將對應(yīng) page 從“回收站”中撈出 
  14.     return p; 
  15.   } 
  16.  
  17.   // 1.2    If P does not exist, find a replacement page (R) from either the free list or the replacer. 
  18.   //        Note that pages are always found from the free list first
  19.   frame_id_t frame_id = -1;  
  20.   Page *p = nullptr; 
  21.   if (!free_list_.empty()) { 
  22.     frame_id = free_list_.back(); // e. 在結(jié)尾處操作效率高一點(diǎn) 
  23.     free_list_.pop_back(); 
  24.     assert(frame_id >= 0 && frame_id < static_cast<int>(pool_size_)); 
  25.     p = pages_ + frame_id; 
  26.      
  27.     // f. 從 freelist 中獲取的 dirty page 已經(jīng)在 delete 時(shí)寫回了 
  28.   } else { 
  29.     bool victimized = replacer_->Victim(&frame_id); 
  30.     if (!victimized) { 
  31.       return nullptr; 
  32.     } 
  33.     assert(frame_id >= 0 && frame_id < static_cast<int>(pool_size_)); 
  34.     p = pages_ + frame_id; 
  35.  
  36.     // 2.     If R is dirty, write it back to the disk. 
  37.     if (p->IsDirty()) { 
  38.       disk_manager_->WritePage(p->GetPageId(), p->GetData()); 
  39.       p->is_dirty_ = false
  40.     } 
  41.     p->pin_count_ = 0; // g. 將元信息 pin_count_ 清空 
  42.   } 
  43.  
  44.   // 3.     Delete R from the page table and insert P. 
  45.   page_table_.erase(p->GetPageId()); // h. 時(shí)刻注意區(qū)分 p->GetPageId() 與 page_id 是否相等,別混用 
  46.   page_table_[page_id] = frame_id; 
  47.  
  48.   // 4.     Update P's metadata, read in the page content from disk, and then return a pointer to P. 
  49.   p->page_id_ = page_id; 
  50.   p->ResetMemory(); 
  51.   disk_manager_->ReadPage(page_id, p->GetData()); 
  52.   p->pin_count_++; 
  53.   return p; 

實(shí)驗(yàn)相關(guān) autograder 可以在 FAQ 中找到注冊地址和邀請碼,提交代碼的時(shí)候最好不要提交 github 倉庫地址,會有很多格式問題。可以每次按照實(shí)驗(yàn)頁面的指示,將相關(guān)文件按目錄結(jié)構(gòu)達(dá)成 zip 包提交即可。

 

提交事項(xiàng)

仔細(xì)閱讀實(shí)驗(yàn)描述,提交前需要注意的事項(xiàng):

  1. 在 build 目錄運(yùn)行 make format ,自動格式化。
  2. 在 build 目錄運(yùn)行 make check-lint,檢查一些語法問題。
  3. 自己針對每個(gè)函數(shù)在本地設(shè)計(jì)一些測試,寫到相關(guān)文件(本實(shí)驗(yàn) buffer_pool_manager_test.cpp )中,并且打開測試開關(guān),在 build 文件夾下,編譯 make buffer_pool_manager_test,運(yùn)行 ./test/buffer_pool_manager_test

貼一個(gè) project1 autograder 的實(shí)驗(yàn)結(jié)果:

 

autograder 結(jié)果

小結(jié)

這是 cmu15445 第一個(gè)實(shí)驗(yàn),實(shí)現(xiàn)了在磁盤和內(nèi)存間按需搬運(yùn)頁(page)的 buffer pool manager。本實(shí)驗(yàn)的關(guān)鍵之處在于把握基本概念,梳理出核心數(shù)據(jù)流,在此基礎(chǔ)上注意一些實(shí)現(xiàn)的細(xì)節(jié)即可。

責(zé)任編輯:武曉燕 來源: 分布式點(diǎn)滴
相關(guān)推薦

2022-10-12 08:52:00

內(nèi)存緩沖管理

2022-10-09 08:53:06

存儲容量SSD

2022-10-08 00:00:00

SQLDDL數(shù)據(jù)

2022-10-17 08:49:47

2022-10-30 10:03:20

B+數(shù)據(jù)庫數(shù)據(jù)

2022-09-30 11:08:44

MySQLPostgreSQLOracle

2011-04-13 15:07:30

數(shù)據(jù)庫系統(tǒng)設(shè)計(jì)

2011-04-13 15:25:12

數(shù)據(jù)庫系統(tǒng)設(shè)計(jì)

2022-04-05 13:46:21

日志數(shù)據(jù)庫系統(tǒng)

2011-02-25 13:49:12

2011-02-28 17:12:20

Oracle數(shù)據(jù)庫

2011-04-13 15:17:09

數(shù)據(jù)庫系統(tǒng)設(shè)計(jì)

2019-03-01 18:27:09

MySQL安裝數(shù)據(jù)庫

2011-06-07 17:01:44

2011-07-26 14:56:03

數(shù)據(jù)庫發(fā)展

2011-05-24 09:45:41

Oracle數(shù)據(jù)庫系統(tǒng)調(diào)優(yōu)

2010-09-17 20:09:25

2010-04-12 14:55:26

Oracle數(shù)據(jù)庫

2010-07-11 18:42:17

CassandraTwitter

2023-12-20 16:12:37

數(shù)據(jù)庫復(fù)制延遲
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 日韩在线播放网址 | 国产又爽又黄的视频 | 亚洲国产高清高潮精品美女 | 中文字幕国产一区 | 国产精品国产自产拍高清 | 午夜视频网站 | av在线免费观看网址 | 亚洲+变态+欧美+另类+精品 | 亚洲视频在线观看 | 国产一区二区三区四区在线观看 | 久久久久久久一区 | 国产精品中文 | 亚洲最色视频 | 久久i| 在线观看中文视频 | 欧美精品首页 | 欧美日韩午夜精品 | 亚洲国产免费 | 玖玖视频免费 | 国产精品污www一区二区三区 | 成人在线视频网址 | 午夜三区 | 日韩欧美在| 97伦理影院 | 玩丰满女领导对白露脸hd | 亚洲第一视频网站 | 亚洲国产成人在线观看 | 中文字幕韩在线第一页 | 日本aa毛片a级毛片免费观看 | 日韩三级 | 亚洲精品国产电影 | 久久99精品久久久97夜夜嗨 | 一区二区在线不卡 | 久久久久电影 | www.99re| 91在线观看视频 | 国产一区精品 | 狠狠夜夜| 欧美日韩亚洲国产 | 狠狠色狠狠色综合日日92 | 久久精品一 |