Linux從頭學:操作系統-如何把頁目錄和頁表當做普通物理頁進行操作的?
目錄
問題描述
- CPU接收的是線性地址,不是物理地址
對頁目錄進行"自操作"
- 一級查表:構造線性地址的前十位
- 二級查表:構造線性地址的中間十位
- 三級查表:構造線性地址的最后十二位
- 三個地址段合體
對頁表進行"自操作"
在 x86 系統中,內存管理中的分頁機制是非常重要的,在Linux操作系統相關的各種書籍中,這部分內容也是重筆濃彩。
如果你看過 Linux 內核相關書籍,一定對下面這張圖又熟悉、又恐懼:

這是 Linux 系統中,頁處理單元的多級頁表查詢方式。
其中黃色背景部分:頁上級目錄索引 和 頁中間目錄索引,是 Linux 系統自己擴展的,在原本的 x86 處理器中是不存在的,這也是導致 Linux 中相關部分代碼更加復雜的原因。
在上一篇文章中,我們主要對 x86 中的頁目錄和頁表的“反向構造”、“正向查找”這兩個過程進行了圖文并茂的討論。文章鏈接在此:Linux從頭學15:【頁目錄和頁表】-理論 + 實例 + 圖文的最完全、最接地氣詳解!,但是其中有一個環節被特意忽略過去了。
那就是:在操作系統構造頁目錄和頁表的時候,如何對它們自身進行尋址和操作?
這部分內容,也是內存管理中比較復雜的地方,就好比一名醫生給病人做手術,但是病人卻是“醫生自己”。
這篇文章,我們繼續通過圖片+實例的方式,一起來研究一下內核代碼一般都是如何來進行這些“自操作”的。
把這里面的操作機制研究透徹之后,再去看 Linux 內核代碼時,就不會暈頭轉向了。
問題描述
在上一篇文章中,我們舉了這樣一個示例:
- 假設實際的物理內存是1 GB;
- 用戶程序文件在硬盤上的長度是20 MB;
- 操作系統把用戶程序加載到內存中時,從 0x4000_0000 的虛擬內存地址處開始存放;
- 操作系統讀取程序結束后,為所有的地址構造好了頁目錄和頁表;
如下圖所示:

頁目錄和頁表的每一個有效表項中,存儲的地址都是一個個實實在在的物理頁的前 20 位(因為一個物理頁的長度固定是 4KB,在分配時都是對齊的,末尾的 12 位全部為 0)。
并且頁目錄和頁表“們”自身,都占用一個物理頁的空間,所以它們都有自己的物理地址。
當頁目錄和頁表都構造妥當之后,處理器面對一個線性地址,例如:0x4100_1800,頁處理單元就會按照分級查表的方式,把這個線性地址轉換為一個物理地址:
- 拆分線性地址:0x4100_1800 = 0100_0001_0000_0000___0001_1000_0000_0000;
- 根據線性地址的前 10 位,找到頁目錄中的索引 260,從而確定頁表的物理地址是 0x0800_4000(表項中的值是 0x08004,還要補上低位的 12 個 0);
- 根據線性地址的中間 10 位,找到 0x0800_4000 這個頁表中的索引 1,從而確定普通物理頁的物理地址是 0x0210_1000(表項中的值是 0x02101,還要補上低位的 12 個 0);
- 根據線性地址的最后 12 位,確定普通頁內的偏移量是 2048,普通頁的開始地址加上這個偏移量,就得到了最終的物理地址 0x0210_1800。
詳細的討論過程,請參考上一篇文章:Linux從頭學15:【頁目錄和頁表】-理論 + 實例 + 圖文的最完全、最接地氣詳解!。
那么,問題來了:
在頁處理單元開啟的情況下,處理器面對的是線性地址,那么操作系統在構造頁目錄中的每一個表項的時候,如何對這個表項進行尋址?
具體到上圖來說就是:操作系統想把第一個頁表的物理地址 0x0800_0000,填寫到頁目錄的第 256 個表項中時,那么 CPU 就需要找到這個表項,這個表項肯定有物理地址的。
但是,我們不能把這個表項的物理地址直接告訴 CPU,因為 CPU 只接收線性地址,它會自動經過分頁單元的處理來得到對應的物理地址。
那么,這個線性地址的值應該是多少呢?
繼續用實例來說明,這樣容易理解。
假設頁目錄所處的物理頁開始地址是 0x0100_0000,那么第256個表項的物理地址就是 0x0100_0400。

有些小伙伴可能會說:直接把物理地址 0x0100_0400 告訴處理器,不就可以了嗎?
這是不對的!
處理器接收的是線性地址,不是物理地址
因為現在已經開啟了分頁處理單元,0x0100_0400 是我們最后想得到的物理地址,而處理器只接受線性地址,雖然我們知道這是一個物理地址,但是處理器不知道啊!
當我們給處理器一個地址的時候,處理器會按部就班的對這個地址進行[段轉換],再進行[頁轉換],這時才得到它認為的物理地址。
由于使用的是“平坦型”的段結構,所以這里就忽略了段處理過程,直接討論頁處理過程。
所以,我們應該使用某些方法,構造出一個線性地址 addr,讓這個地址經過頁處理單元之后,得到 0x0100_0400 這個物理地址:
這里有點遞歸的味道,又有點像一個醫生給他自己做一個外科手術!
現在,應該明白面對的問題了吧?
目標就是:通過某種方法,構造出一個線性地址 addr,并且通過頁處理單元轉換之后,得到物理地址 0x0100_0400。
對頁目錄進行操作
重新梳理一下思路:如果對一個普通物理頁(下文簡稱為:普通頁)里的一個地址處的數據進行操作,需要經過3次查表操作:
從頁表的某個表項中,找到的那個物理地址,就是最后要操作的普通物理頁。
現在我們的問題是:需要把頁目錄作為最終的操作對象。
也就是說,從頁表中找到的“普通頁”的物理地址,應該等于頁目錄的物理地址!
作為一名軟件開發人員,遞歸思想都是有的。
我們就來構造一個線性地址 addr,讓它經過3次查表操作之后,能夠指向頁目錄的物理地址。
一級查表:構造線性地址的前 10 位,來確定頁表的物理地址
一級查表:查找的對象是頁目錄。
線性地址addr的前10位,決定了頁目錄內的索引。
很顯然,需要讓這個索引對應的那個表項中所登記的地址,必須是指向頁目錄自己才可以。
常用的解決方案是:利用頁目錄中的最后一個表項,讓這個表項中記錄的地址,指向頁目錄自己,如下圖所示:
也就是說,預先在頁目錄的最后一個表項中,填入頁目錄自己的物理地址,然后只要線性地址addr前10位的值為 1023,就能夠得到這個表項。
很容易就能得到addr的前10位應該是:0x3FF(二進制:1111_1111_11)。
由于這個表項中存儲的地址是頁目錄自己的開始地址(0x0100_0000, 最后的12個0是自動補上的),這樣就相當于:下面進入第二級查找時,頁目錄即將被當做“頁表”來使用。
如下圖所示:

這里紅色虛線的“頁表”其實就是頁目錄自己,只是一個影子而已。
二級查表:構造線性地址的中間 10 位,來確定“普通頁”的物理地址
二級查表:查找的對象是頁表,也就是一級查表得到的那個“頁表”。
雖然一級查表的結果是頁目錄自己,但是處理器不管這些,它會把這個表當做頁表來使用。
現在,來考慮線性地址addr的中間10位,它決定了頁表中的索引號。
很顯然,需要繼續讓這個索引號對應的那個表項中,記錄的地址必須繼續指向頁目錄自己。
那就繼續利用這個“頁表”(其實它是頁目錄)中的最后一個表項唄,就是index = 1023的這個表項。
這個表項中存儲的物理地址,即將是最終查表得到的“普通頁”的物理地址了。
由于這個表項中,被預先填寫了 0x01000,補上尾部的12個0之后就是 0x0100_0000,仍然指向頁目錄自己,完美!
于是,就得到了中間10位的結果:0x3FF(二進制:11_1111_1111)。
如下圖所示:
最右面紅色虛線的“物理頁”,就是二級查找的結果,它本質上仍然是頁目錄本身,只不過它即將被當做一個普通物理頁來使用。
三級查表:構造線性地址的最后 12 位,來確定“普通頁”的頁內偏移量
現在,已經構造出了線性地址addr(這是我們的最終目標)的前20位,并且經過頁表的前兩級查表,成功的定位到了頁目錄自己!
就差最后一步了!
我們知道,從線性地址到物理地址的轉換過程中,最后的12位表示頁內偏移,是直接從線性地址中取過來的。
也就是說:線性地址 與 物理地址 的最后12位偏移量,值是一樣的!
所以,我們就反過來倒推一下:
我們最終想操作的是頁目錄中第256個表項,它的物理地址是 0x0100_0400,這個物理地址距離這個頁目錄開始位地址的偏移量是:0x400(0x0100_0400 減去 0x0100_0000)。
因此,線性地址addr中的最后12位的值也應該是 0x400。
三個地址段合體
把上面三個步驟中,得到的地址聚合在一起:
0xFFFF_F400 就是最終想得到的線性地址!
也就是說,我們只要把這個線性地址 0xFFFF_F400 告訴處理器,它就會經過頁處理單元的轉換,最終查找到頁目錄這個物理頁中的第 256個表項,也就是物理地址 0x0100_0400。
例如:mov [0xFFFF_4000], xxxx
以上就是操作系統在操作頁目錄自身時,所采取的策略。
具體到每個操作系統來說,可能稍微有差別,但是其中的道理都是差不多的。
例如本文開頭的第一張圖中,Linux 使用了4級表格來查找,并且中間的兩個表格還可以省略不用。
如何跨過中間的這兩個表格,Linux 內核代碼中的代碼更復雜一些,但是策略都是一樣的。
對頁表進行尋址
既然已經弄明白了操作系統是如何操作頁目錄的,那么對頁表的操作就不是什么大問題了。
比如下面這張圖:
目標:把最右面的普通物理頁地址 0x0200_0000,放入 0x0800_0000 這個頁表的第一個表項中(只需要存儲前20位),那么應該傳遞什么樣的線性地址給處理器?
思路是完全一樣的。
一級查表
按照正常的分頁查找流程,從頁目錄的某個表項中,查找我們想操作的那個頁表。
頁目錄中的這個表項位于索引值256的地方,因此可以構造出線性地址的前10位是:0100_0000_00(0x100)。
所以,經過一級查表得到的這個頁表的物理地址是 0x0800_0000。
二級查表
利用這個頁表的最后一個表項(index = 1023),預先填寫一個地址(0x08000),讓它指向這個頁表自己的開始物理地址。
于是,可以構造出線性地址的中間10位是:11_1111_1111(0x3FF)。
由于這個表項中存儲的地址是 0x0800_0000,指向的正是頁表自己,只不過馬上它就被當作普通物理頁被使用。
三級查表
此時,已經找到最后的普通物理頁了(其實它是一個頁表,被當作普通物理頁使用)。
線性地址的最后12位,可以直接從最后想操作的那個目標物理地址中最后12位直接拿過來。
我們的目標是:操作頁表中的第 0 個表項,這個表項的物理地址是 0x0800_0000,最后的12位偏移量是 0000_0000_0000。
把以上3個地址段合體,即可得到正確的線性地址:
這里討論的方法,并不是處理頁目錄和頁表的唯一方式。
當處理邏輯更加復雜時,可能需要對頁目錄或頁表中更多的表項,進行一些特殊的預處理。
如果你想挑戰一下,可以看一下Linux內核中的相關文檔或代碼!
在這個系列中,關于頁目錄和頁表的知識點就介紹結束了。
如果文中有錯誤或者誤導的地方,非常期待與您一起探討、學習!
寫這篇文章真不容易,讓我深深的體會到那句話:
寫作就是:將網狀的思考-通過樹狀的結構-用線性的語言清晰的表達出來。
本文轉載自微信公眾號「IOT物聯網小鎮」
【編輯推薦】