成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

ARM64 Linux內核頁表的塊映射

系統 Linux
內核文檔Documentation/arm64/memory.rst描述了ARM64 Linux內核空間的內存映射情況,應該是此方面最權威文檔。

[[361287]]

內核文檔Documentation/arm64/memory.rst描述了ARM64 Linux內核空間的內存映射情況,應該是此方面最權威文檔。

以典型的4K頁和48位虛擬地址為例,整個內核空間的虛擬地址分布如下:

 

從ffff000000000000到ffff7fffffffffff是一段針對物理地址的線性映射區,最大支持128TB的物理地址空間,這一段地址非常類似ARM32的low memory映射區。

我們看看這種情況下的頁表,我們既可以用最終的【20:12】對應的PTE映射項,以4K為單位,進行虛擬地址到物理地址的映射;又可以以【29:21】對應的PMD映射項,以2M為單位,進行虛擬地址到物理地址的映射。

 

對于用戶空間的虛擬地址而言,當我們進行的是PMD映射的時候,我們得到的是Huge Page,ARM64的2MB的huge page,在虛擬和物理上都連續,它在實踐工程中的好處是,可以減小TLB miss,因為,如果進行了2MB的映射,整個2MB不再需要PTE,映射關系大為減小。

 

對于內核空間而言,從ffff000000000000到ffff7fffffffffff的這段虛擬地址,如果與物理地址進行的是一種PMD映射的話,顯然也可以達到同樣的效果。但是,這不意味著它們就是Huge Page。眾所周知,內核開機把物理地址往虛擬地址進行線性映射,并不意味著這片內存被內核拿走了,它只是進行了一種映射,以便日后調用kmalloc(),get_free_pages()等API申請的內存是直接已經有虛實映射的。所以,即便內核進行的就是PMD映射,在內存的分割上,還是可以以4K為單位的:

 

所以,即便我們在內核空間進行PMD映射,里面的每個藍色圓圈(一個4K頁),還是可以被單獨分配的,這種分配可以是kmalloc、vmalloc,用戶態的malloc等。內核態進行的PMD映射,不意味著相關的2MB成為了huge page,它純粹只是為了服務于當內核以線性映射的虛擬地址訪問該物理地址的時候(我們認為內核大多數時候是用這個線性映射的虛擬地址的),減小TLB miss。

當然,更牛逼的情況下,內核應該也可以直接用【38:30】位的PUD來進行映射,這樣映射關系是1GB的,則整個1GB后面占TLB的時候,只需要占一個入口。

 

當然,如果用戶態的虛實映射是這樣的,用戶實際得到了一個1GB的巨頁。但是對于內核的線性映射區域而言,即便我們進行了1GB的PUD映射,這1G內部就可以進一步切割為4KB頁或者2MB的巨頁。記?。簝群藨B的線性映射區的映射只是個映射關系,不是個分配關系。比如下面的1GB的內核線性映射的1GB區域,仍然可以被4K分配走,或者被用戶以huge page以2MB為單位分配走:

 

我們需要一個真實的調試手段來驗證我們的想法,這個調試手段就是PTDUMP(Page Table Dump),相關的代碼在ARM64內核的:

arch/arm64/mm/ptdump.c和ptdump_debugfs.c

我們把它們全部選中,這樣我們可以得到一個debugfs接口:

/sys/kernel/debug/kernel_page_tables

來獲知內核態頁表的情況。

我用qemu啟動了一個4GB內存的ARM64虛擬機,可以看到前1GB的虛擬地址空間大多數是PMD和PTE映射,后面的3GB,全是PUD映射:

 

我的內核啟動參數加了rodata=0:

$ cat /proc/cmdline root=/dev/vda2 rw console=ttyAMA0 ip=dhcp rodata=0

原因是內核在幾種情況下,是不會做這種PMD和PUD映射的,相關代碼見于:

 

rodata_full在默認情況下總是成立的,它對應著內核的一個Config選項CONFIG_RODATA_FULL_DEFAULT_ENABLED, "Apply r/o permissions of VM areas also to their linear aliases",這個選項提高了內核的安全性,但是減小了內核的性能。

 

我在內核啟動參數加的rodata=0實際上是讓rodata_full為false。如果我把這個kernel啟動選項去掉,我得到的內核頁表是完全不一樣,線性映射區也全部是PTE映射:

 

最后,值得一提的是,不僅線性映射區可以使用PMD映射,vmemmap映射區也是在4K頁面情況下,默認用PMD映射的:

 

字節跳動的宋牧春童鞋發了一個patchset,企圖在用戶分得巨頁的情況下,刪除巨頁內部的4KB的小page占用的page struct的內存消耗,這個patchset在圣誕節前目前發到了V11:

https://lore.kernel.org/linux-mm/20201222142440.28930-1-songmuchun@bytedance.com/

 

在這個patchset中,它就需要拆分vmemmap的PMD映射為PTE映射:

 

 

這個patchset的原理建立在,當內核以4KB分頁的時候,每個page需要64字節的page struct。但是,當用戶把它分配為巨頁的時候,時候,我們不再需要一個個4KB單獨用page struct描述,對于這種compound page的情況,我們應該可以把后面的page struct的內存直接釋放掉,因為情況完全是雷同的,這樣可以剩下不少內存。

本文轉載自微信公眾號「Linux閱碼場  」,可以通過以下二維碼關注。轉載本文請聯系Linux閱碼場公眾號。宋寶華  

 

責任編輯:武曉燕 來源: Linux閱碼場
相關推薦

2021-01-31 09:26:15

ARM64內核虛擬地址Linux

2021-06-29 13:00:11

微軟Windows 11Windows

2021-05-10 08:05:13

Linux內核頁表

2023-05-15 08:58:41

塊設備驅動Linux

2013-09-03 16:34:57

Linux分布式文件系統

2022-09-06 08:02:32

LinuxLKRG安全

2023-05-09 09:00:39

7-Zip開源壓縮軟件

2018-05-18 09:07:43

Linux內核內存

2022-11-09 07:21:26

微軟Windows

2020-11-20 07:55:55

Linux內核映射

2021-12-07 07:41:14

Windows 11操作系統微軟

2021-07-04 07:00:56

微軟Windows 11Windows

2023-05-26 09:20:22

Windows微軟

2021-09-28 15:03:06

Linux內核arm

2022-06-10 10:37:33

Linux

2021-05-27 05:24:48

Windows10操作系統微軟

2025-01-06 23:33:04

2020-09-23 06:53:48

Linux內核架構

2022-11-11 08:09:10

C++Arm64MSVC
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲毛片在线观看 | 日本一区二区高清视频 | 欧美精品一区二区三区四区五区 | 国产一区二区免费 | 日韩亚洲一区二区 | 中文日韩字幕 | 亚洲成人在线免费 | 国产精品mv在线观看 | 欧美精品成人一区二区三区四区 | 日韩一区二区在线视频 | 久久国产成人 | 日韩电影一区 | 精品伊人久久 | 亚洲精选久久 | 国产一区二区视频在线观看 | 亚洲视频免费在线看 | 精品久久久久久久久久 | 国产成人精品一区二区 | 五月综合久久 | 日本一二三区在线观看 | 国产精品一区视频 | 成人av在线播放 | 热99| 精品亚洲一区二区 | 国产激情精品一区二区三区 | 国产精品久久久久久二区 | 国产亚洲日本精品 | 黄色免费在线观看 | 国产精品国产精品国产专区不蜜 | 欧美黄色精品 | 在线视频亚洲 | 欧美日韩在线电影 | 国产成人精品一区二区三区四区 | 粉嫩av久久一区二区三区 | 麻豆av电影网 | 久久久久国产 | 欧美在线观看一区二区 | 一级视频在线免费观看 | 中文字幕久久精品 | a在线免费观看视频 | 国产一区二区三区在线看 |