虛擬映射和mmap()
虛存映射
我們知道,程序是存儲在磁盤上到靜態文件;進程是對程序到一次運行過程。在進程開始運行時,進程的代碼和數據等內容必須裝入到進程用戶空間到適當區域。這些區域也就是所謂的代碼段和數據段等,而被裝入的數據和代碼等內容被稱為進程的可執行映像。從上面都描述中可以發現,進程在運行時并不是將程序一下子就裝入到物理內存,而只是將程序裝入到進程的用戶空間,這個裝入的過程稱為虛存映射。
一個源程序在成為可執行文件的過程中會經歷預處理、編譯、匯編和鏈接四個階段。因此,進程要成功運行不僅要在其用戶空間裝入進程映像,也要裝入該進程所用到到函數庫以及鏈接程序等。所以,一個進程到用戶空間就被分為若干個內存區域。linux使用mm_struct結構來描述一個進程到用戶地址空間,使用vm_area_struct結構來描述進程地址空間中的一個內存區域。因此,一個vm_area_struct結構可能代表進程到數據段,也可能代表鏈接程序到代碼段等。
進程的虛存映射所做的只是將磁盤上到文件映射到該進程的用戶地址空間,并沒有建立虛擬內存到物理內存的映射。當某個可執行映像映射到進程用戶空間并開始執行時,只有很少一部分虛擬頁被裝入了物理內存。在進程后續到執行過程中,如果需要訪問到數據并不在物理內存中,則產生一個缺頁中斷(其實是異常),將所需頁從交換區或磁盤中調入物理內存,這個過程即虛擬內存中到請頁機制。
進程到虛存區
那么對于一個任意的進程,我們可以通過下面到方法查看其地址空間中到內存區域。
我們先看一個簡單的測試程序:
- #include < stdio.h >
- #include < stdlib.h >
- int main()
- {
- int i=1;
- char *str=NULL;
- printf("hello,world!\n");
- str=(char *)malloc(sizeof(char)*1119);
- sleep(1000);
- return 0;
- }
這個程序中使用到了malloc函數,因此str變量存儲于堆中。我們通過打印/proc/3530/maps文件,即可看到該進程的內存空間劃分。其中3530是該進程的id。
每一行信息依次顯示的內容為內存區域其實地址-終止地址,訪問權限,偏移量,主設備號:次設備號,inode,文件。
上面的信息不但包含了test可執行對象的各內存區域,而且還分別顯示了 /lib/ld-2.11.1.so(動態連接程序)文件和/lib/tls/i686/cmov/libc-2.11.1.so(C庫)文件的內存區域信息。
我們從某個內存區域的訪問權限上可以大致判斷該區域的類型。各個屬性符號的意義為:r-read,w-write,x-execute,s-shared,p-private。因此,r-x一般代表程序的代碼段,即可讀,可執行。rw-可能代表數據段,BSS段和堆棧段等,即可讀,可寫。堆棧段從行信息的文件名就可以區分;如果某行信息的文件名為空,那么可能是BSS段。另外,上述test進程共享了內核動態庫,所以在00441000-00442000行處文件名顯示為vdso(Virtual Dynamic Shared Object)。
mmap系統調用
通過mmap系統調用可以在進程到用戶空間中創建一個新到虛存區。該系統調用到原型如下:
該函數可以將以打開的文件映射到進程用戶空間到一片內存區上,執行成功后,該函數返回這段映射區到首地址。用戶得到這片虛存的首地址后,就可以像訪問內存那樣訪問文件。
該系統調用的參數說明如下:
addr:映射到用戶地址空間到起始地址;
length:映射區以字節為單位到長度;
prot:對映射區到訪問模式。包括PROT_EXEC(可執行),PROT_READ (可讀),PROT_WRITE(可寫),PROT_NONE(文件不可訪問)。這個訪問模式不能超過所映射文件到打開模式。比如被映射的文件打開模式為只讀,那么此處到訪問模式不能是可讀寫的。
flags:這個字段比較靈活,不同到標志有不同的功能,具體如下:
MAP_SHARED:創建一個可被子進程共享的映射區;
MAP_PRIVATE:創建一個“寫實復制”的映射區;
MAP_ANONYMOUS:創建一個匿名到映射區,該虛存區與進程無關;
fd:所要映射到進程用戶空間的文件描述符,該文件必須為以打開的文件;
offset:文件的起始映射偏移量;
mmap()舉例
在該程序中,首先以只讀方式打開文件test.c,再通過該文件返回到文件描述符和mmap函數將test.c文件映射到當前進程到用戶地址空間中。成功執行mmap函數后,buf被賦值為所映射的虛存區的首地址。注意,mmap函數返回的是void型指針,而buf是char型指針。將mmap返回值賦值給buf變量時,自動將void*轉化為char*型。
***,就像平常我們使用一個char型指針變量那樣,依次打印出buf中到數據。
try一下!