Linux 內(nèi)存分配流程及 Kmalloc 解析
上一次咱們分析了 Linux 的啟動流程和初始化流程,今天主要分析一下內(nèi)存方面的初始化和常見的內(nèi)存分配方式。
在 start_kernel 內(nèi)核初始化函數(shù)中,一共調(diào)用 86 個函數(shù)去初始化,其中有一個 mm_init 函數(shù),用以初始化內(nèi)存。
- start_kernel
- |--->mm_init
- |--->mem_init
linux4.14/init/main.c
在 mem_init 函數(shù)中會初始化伙伴系統(tǒng)和 slab 分配器。
先說兩個概念:
外部碎片:有一段小內(nèi)存,夾在兩個大內(nèi)存中間,兩個大內(nèi)存已經(jīng)被分配給進程,這一段小內(nèi)存由于過小,不夠申請者使用,就一直空閑。
內(nèi)部碎片:一個進程申請了一段內(nèi)存,可是這個進程從來沒有全部使用,一直有最后的一段內(nèi)存沒有使用。
為了解決這兩個問題,就出現(xiàn)了伙伴系統(tǒng)和 slab 分配器?;锇橄到y(tǒng)解決外部碎片問題,slab 分配器解決內(nèi)部碎片問題。
1、伙伴系統(tǒng)基于頁分配,一次分配多頁,這樣就不會出現(xiàn)夾在中間的小內(nèi)存。
2、slab 分配器基于字節(jié)來分配,特別適用于需要頻繁分配幾十個字節(jié)的結(jié)構(gòu)體,我們經(jīng)常使用的 kmalloc 就是基于 slab 分配器。
3、其實所有的分配方式最底層都是伙伴系統(tǒng),它先分配好一段大的內(nèi)存,然后 slab 再從其中分配小的內(nèi)存。
具體分析請看鏈接:
https://www.cnblogs.com/arnoldlu/p/8251333.html
這里列出了常見的內(nèi)存分配 API 接口。
其中最常用的就是 malloc 和 kmalloc,區(qū)別在于一個在用戶空間,一個在內(nèi)核空間,并且 kmalloc 的使用需要注意競爭,需要指明 flag 。
- void *kmalloc(size_t size, int flags);
內(nèi)核編程(驅(qū)動編程)一定要注意競爭問題,重要的數(shù)據(jù)或者內(nèi)存使用前后一定要加鎖。
在 kmalloc 的使用過程中,常用標(biāo)志位:GFP_KERNEL、GFP_ATOMIC、GFP_USER、GFP_HIGHUSER、GFP_NOIO、GFP_NOFS。
前兩個最常用,GFP_KERNEL 代表在使用 kmalloc 分配內(nèi)存時,如果內(nèi)存準(zhǔn)備不足,會等待,也就是會睡眠。GFP_ATOMIC 代表使用 kmalloc 分配內(nèi)存時,如果內(nèi)存準(zhǔn)備不足,會立刻返回,不會引起睡眠,適合在中斷上下文或者進程上下文中使用。
補充:
1、基于 slab 分配器,出現(xiàn)了 slob 和 slub 分配器。在多核大系統(tǒng)大內(nèi)存中,一般使用 slub 分配器,在極小的嵌入式系統(tǒng)中,一般使用 slob 分配器(只有600多行代碼)。
2、有的人可能知道 Linux 有一個 bootmem 分配器,這個是在Linux初始化過程中的一個臨時分配器,他會在 setup_arch 函數(shù)中初始化,然后在 mm_init 中關(guān)掉,只是在伙伴系統(tǒng)出現(xiàn)之前的臨時使用。
bootmem 分配器按塊進行分配,顆粒度很大,不夠精細,比較浪費內(nèi)存。bootmem 分配器只會在 start_kernel 函數(shù)和mm_init 函數(shù)之前存在,中間的函數(shù)會調(diào)用它進行內(nèi)存分配。
- start_kernel
- |--->setup_arch
- |--->paging_init
- |--->bootmem_init