Linux磁盤分區對齊詳解與配置
什么是磁盤分區對齊(Disk Alignment、Partition Alignment)
Windows的磁盤有一種結構叫做Master Boot Record(MBR), 它的默認大小為63個Block(每個大小為512字節)。它的存在使得磁盤的初始位置和的磁盤上***個分區的初始位置有63個Block的錯位。如果磁盤的單個Track大于63個Block的話。這就會導致默認的初始的位置是從第64個開始。使文件系統的中的Track和位于磁盤中的兩個Track之上。這種不對齊現象會導致存儲系統的性能下降,原因是單個I/O請求會跨越多個磁盤上的Track,從而導致存儲系統的額外性能開銷。特別是對于一些隨機I/O比較較大的應用程序,影響將更大。
而對于Windows 2003以后支持的GPT Disk,也會存在磁盤分區不對齊的現象,但是結構有所不同。如圖1所示(圖中單位為Block,512字節),所有的分區由1MB大小(2048 Block)構成,***個分區從LBA 34開始,即17KB大小位置。這也就意味著所有的分區會有17KB的不對齊的情況發生。同樣會導致I/O讀寫性能影響。
存儲系統的磁道區域與Linux分區對齊問題
出于***化性能需求,任何到后端存儲陣列的I/O需要通過配置適當的結構化,從而避免任何I/O操作跨界現象的發生。如果I/O操作跨越多個界限,會帶來額外的資源開銷從而造成性能下降。所以,為了避免因為分區不對齊所造成的性能影響。需要使用工fdisk或者parted工具創建和對齊分區。
如何選擇一個正確的磁盤分區offset值,基本上EMC和其他廠商建議的值都是“64KB”。為什么要選擇64KB這個值呢,這里解釋一下。首先講一下一個叫做物理磁道區域的概念。因為對于不同類型的保護級別,也可以說叫Raid和磁盤類型,這個區域的范圍有所不同的。我們舉兩個個例子:
Symmetrix緩存中的磁道區域單位大小為一個Track,即64個Block、32KB大小。如圖2所示,如果磁盤分區沒有被對齊,則任何32KB或者更大的I/O就需要跨越兩個Track來進行,50%的16KB的I/O會可能會跨越兩個Track,25%的8KB也會跨越兩個Track,造成額外的存儲系統性能開銷。
看了***個例子,讀者可能會想,那把起始位右移一個Block就好了啊,(MBR+Reserved=63Block),就不會有跨Track的I/O發生了。接下來我們再看另外一個例子。一個3+1 Raid5的單個條帶大小為四個Track,即256個Block、128KB大小。如果對于這類的磁盤,使用第64個block為起始位置,當linux I/O大小達到64KB的時候,如果I/O直接從緩存(單個track為32KB),則正好完成兩次讀取。但是如果,兩個連續的64KB I/O,且需要牽涉到后端Raid5的物理磁盤讀寫,如下圖所示,第二個64KB就會出現跨越兩個條帶的情況發生,從而倒是讀或者寫的開銷加倍。
在這種情況下,需要將起始位置調節成建議配置(64KB),這樣一來,Linux***I/O大小的情況也不會發生跨多個條帶的情況發生了。(圖3)
所以說,無論是從存儲系統的緩存從讀取數據,還是I/O在緩存中不存在的情況,需要從底層物理磁盤上讀取數據。對于不同類型的磁盤,64KB的起始為是一個建議配置。
Linux創建分區對齊方法
描述了磁盤分區對齊的原理后,下面介紹如何使用fdisk創建對齊分區的例子。在Linux中,對齊分區操作需要要空數據的情況下進行,因為對齊分區操作會清空分區表并且該LUN上的數據會被刪除。在這個例子中,我們對/dev/emcpowerfw設備,創建一個大小為51281 Cylinder(Cylinder是Symmetrix的計量單位,每個Cylinder大小為960KB,所以這個磁盤大小為50GB左右)、Offset錯位大小為128個block的磁盤設備。方法和命令輸出(圖4)如下
方法1,使用fdisk創建分區對齊
Linux命令提示符下輸入:
# fdisk /dev/emcpowerfw
輸入n,創建一個分區:
輸入p,創建分區為主分區:
輸入起始Cylinder位置,默認為***個:
輸入***Cylinder位置,默認為該磁盤設備的***一個Cylinder:
輸入x進入expect mode:
輸入b,一定分區初始位置:
設定最初位置為128個block(128 block大小為64KB):
再次輸入p確認分區初始位置信息:
輸入w保存退出:
方法2:使用parted創建對齊分區
Parted和fdisk相比,支持更多的類型(支持GPT)和更大的分區尺寸。下面一個例子給出一個給dev/sdb磁盤創建128bloc分區起始位的例子,方法和命令輸出如下(圖5)
Linux命令提示符下輸入:
# parted /dev/sdb
將顯示單位調整為Sector(大小512個字節):
(parted) unit s
列出當前邏輯卷:
(parted) print
將原來Number1移除并且創建一個起始位為128 sector,小為976735934 sector的主分區。
(parted) rm 1
(parted) mkpart primary 128 976735934
(parted) print
參考
Parted命令手冊及參數:http://www.gnu.org/software/parted/manual/parted.html#unit
Fdisk命令手冊及參數:http://manpages.courier-mta.org/htmlman8/fdisk.8.html
磁盤分區對齊詳解與配置 - Windows篇 : https://community.emc.com/docs/DOC-18571
磁盤分區對齊詳解與配置 – Linux篇 : https://community.emc.com/docs/DOC-18666