成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Linux日志文件系統(tǒng)原來是這樣工作的

系統(tǒng) Linux
文件系統(tǒng)要解決的一個關(guān)鍵問題是怎樣防止掉電或系統(tǒng)崩潰造成數(shù)據(jù)損壞,在此類意外事件中,導(dǎo)致文件系統(tǒng)損壞的根本原因在于寫文件不是原子操作,因為寫文件涉及的不僅僅是用戶數(shù)據(jù),還涉及元數(shù)據(jù)(metadata)包括 Superblock、inode bitmap、inode、data block bitmap等,所以寫操作無法一步完成...

[[353758]]

文件系統(tǒng)要解決的一個關(guān)鍵問題是怎樣防止掉電或系統(tǒng)崩潰造成數(shù)據(jù)損壞,在此類意外事件中,導(dǎo)致文件系統(tǒng)損壞的根本原因在于寫文件不是原子操作,因為寫文件涉及的不僅僅是用戶數(shù)據(jù),還涉及元數(shù)據(jù)(metadata)包括 Superblock、inode bitmap、inode、data block bitmap等,所以寫操作無法一步完成,如果其中任何一個步驟被打斷,就會造成數(shù)據(jù)的不一致或損壞。

舉一個簡化的例子,我們對一個文件進行寫操作,要涉及以下步驟:

  1. 從data block bitmap中分配一個數(shù)據(jù)塊;
  2. 在inode中添加指向數(shù)據(jù)塊的指針;
  3. 把用戶數(shù)據(jù)寫入數(shù)據(jù)塊。
  • 如果步驟2完成了,3未完成,結(jié)果是數(shù)據(jù)損壞,因為該文件認(rèn)為數(shù)據(jù)塊是自己的,但里面的數(shù)據(jù)其實是垃圾;
  • 如果步驟2完成了,1未完成,結(jié)果是元數(shù)據(jù)不一致,因為該文件已經(jīng)把數(shù)據(jù)塊據(jù)為己有,然而文件系統(tǒng)卻還認(rèn)為該數(shù)據(jù)塊未分配、隨后又可能會把該數(shù)據(jù)塊分配給別的文件、造成數(shù)據(jù)覆蓋;
  • 如果步驟1完成了、2未完成,結(jié)果就是文件系統(tǒng)分配了一個數(shù)據(jù)塊,但是沒有任何文件用到這個數(shù)據(jù)塊,造成空間浪費;
  • 如果步驟3完成了,2未完成,結(jié)果就是用戶數(shù)據(jù)寫入了硬盤數(shù)據(jù)塊中,但白寫了,因為文件不知道這個數(shù)據(jù)塊是自己的。

日志文件系統(tǒng)(Journal File System)就是為解決上述問題而誕生的。

它的原理是在進行寫操作之前,把即將進行的各個步驟(稱為transaction)事先記錄下來,保存在文件系統(tǒng)上單獨開辟的一塊空間上,這就是所謂的日志(journal),也被稱為write-ahead logging,日志保存成功之后才進行真正的寫操作、把文件系統(tǒng)的元數(shù)據(jù)和用戶數(shù)據(jù)寫進硬盤(稱為checkpoint),這樣萬一寫操作的過程中掉電,下次掛載文件系統(tǒng)之前把保存好的日志重新執(zhí)行一遍就行了(術(shù)語叫做replay),避免了前述的數(shù)據(jù)損壞場景。

有人問如果保存日志的過程中掉電怎么辦?最初始的想法是把一條日志的數(shù)據(jù)一次性寫入硬盤,相當(dāng)于一個原子操作,然而這并不可行,因為硬盤通常以512字節(jié)為單位進行操作,日志數(shù)據(jù)一超過512字節(jié)就不可能一次性寫入了。所以實際上是這么做的:給每一條日志設(shè)置一個結(jié)束符,只有在日志寫入成功之后才寫結(jié)束符,如果一條日志沒有對應(yīng)的結(jié)束符就會被視為無效日志,直接丟棄,這樣就保證了日志里的數(shù)據(jù)是完整的。

一條日志在它對應(yīng)的寫操作完成之后就沒用了,占用的硬盤空間就可以釋放。保存日志的硬盤空間大小是有限的,被循環(huán)使用,所以日志也被稱為circular log。

至此可以總結(jié)一下日志文件系統(tǒng)的工作步驟了:

  1. Journal write : 把transaction寫入日志中;
  2. Journal commit : 在一條日志保存好之后,寫入結(jié)束符;
  3. Checkpoint : 進行真正的寫操作,把元數(shù)據(jù)(metadata)和用戶數(shù)據(jù)(user data)寫入文件系統(tǒng);
  4. Free : 回收日志占用的硬盤空間。

以上方式把用戶數(shù)據(jù)(user data)也記錄在日志中,稱為Data Journaling,Linux EXT3文件系統(tǒng)就支持這種方式,這種方式存在效率問題:

就是每一個寫操作涉及的元數(shù)據(jù)(metadata)和用戶數(shù)據(jù)(user data)實際上都要在硬盤上寫兩次,一次寫在日志里,一次寫在文件系統(tǒng)上。元數(shù)據(jù)倒也罷了,用戶數(shù)據(jù)通常比較大,拷貝幾個GB的電影文件也要乘以2實在是降低了效率。

一個更高效的方式是Metadata Journaling,不把用戶數(shù)據(jù)(user data)記錄在日志中,它防止數(shù)據(jù)損壞的方法是先寫入用戶數(shù)據(jù)(user data)、再寫日志,即在上述”Journal write”之前先寫用戶數(shù)據(jù),這樣就保證了只要日志是有效的,那么它對應(yīng)的用戶數(shù)據(jù)也是有效的,一旦發(fā)生掉電故障,最壞的結(jié)果也就是最后一條日志沒記完,那么對應(yīng)的用戶數(shù)據(jù)也會丟,效果與Data Journaling丟棄日志一樣,重要的是文件系統(tǒng)的一致性和完整性是有保證的。

Metadata Journaling又叫Ordered Journaling,大多數(shù)文件系統(tǒng)都采用這種方式。像Linux EXT3文件系統(tǒng)也是可以選擇Data Journaling還是Ordered Journaling的。 

 

責(zé)任編輯:龐桂玉 來源: 民工哥技術(shù)之路
相關(guān)推薦

2022-12-14 07:32:40

InnoDBMySQL引擎

2018-04-02 15:13:21

網(wǎng)絡(luò)

2023-02-15 08:17:38

2024-04-30 08:22:51

Figma圖形編輯變換矩陣

2025-02-17 09:22:16

MySQLSQL語句

2022-05-05 08:55:12

工業(yè)物聯(lián)網(wǎng)IIoT

2024-02-06 09:30:25

Figma矩形矩形物理屬性

2023-05-22 15:58:11

2020-05-26 08:52:36

Java JVM多態(tài)

2016-10-12 08:54:24

2014-07-21 10:32:52

蘋果公司實習(xí)

2021-08-17 07:00:00

雙重檢查鎖Nacos

2015-03-25 09:55:34

程序員程序員修補BUG真正原因

2018-10-26 10:41:19

2022-07-13 10:37:59

服務(wù)器故障優(yōu)化

2017-05-09 15:39:33

ensorFlow機器人機器學(xué)習(xí)

2020-03-23 08:30:12

程序員男友感受

2020-06-15 14:35:40

樹莓派代碼開發(fā)

2017-06-06 15:13:07

點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产一级片91 | 欧美综合久久 | 成人一区二区在线 | 欧美老妇交乱视频 | 欧美精品免费观看二区 | 影音先锋成人资源 | 天天操精品视频 | 黄视频在线网站 | 国产精品久久久久久久模特 | 欧美精品一区二区三区蜜桃视频 | 日韩欧美一区二区三区四区 | 欧美一区二区三区四区视频 | 天堂一区二区三区四区 | 欧美精品在线观看 | 欧美一页 | 成年无码av片在线 | 精品欧美一区免费观看α√ | 国产成人免费 | 久久久久久久久久久久久9999 | 久久成人久久 | 久久婷婷色 | 视频一区二区在线观看 | 69电影网 | 日韩精品一区二区三区 | 一道本在线 | 国产成人综合一区二区三区 | 久久久国产精品网站 | 91福利网| 国产高清视频一区 | 国产欧美视频一区二区 | 亚洲精品在线播放 | 亚洲免费视频一区 | 国产在线精品一区二区三区 | 国产精品污www在线观看 | 国产高清在线观看 | 操操操日日日 | 国产精品无码久久久久 | 国产精品成人69xxx免费视频 | 岛国二区 | 一级a性色生活片久久毛片波多野 | 国产精品一区二区三区在线 |