函數調用時棧是如何變化的?
大家都知道函數調用是通過棧來實現的,而且知道在棧中存放著該函數的局部變量。但是對于棧的實現細節可能不一定清楚。本文將介紹一下在Linux平臺下函數棧是如何實現的。
棧幀的結構
函數在調用的時候都是在棧空間上開辟一段空間以供函數使用,所以,我們先來了解一下通用棧幀的結構。
如圖所示,棧是由高地址向地地址的方向生長的,而且棧有其棧頂和棧底,入棧出棧的地方就叫做棧頂。
在x86系統的CPU中,rsp是棧指針寄存器,這個寄存器中存儲著棧頂的地址。rbp中存儲著棧底的地址。函數棧空間主要是由這兩個寄存器來確定的。
當程序運行時,棧指針rsp可以移動,棧指針和幀指針rbp一次只能存儲一個地址,所以,任何時候,這一對指針指向的是同一個函數的棧幀結構。
而幀指針rbp是不移動的,訪問棧中的元素可以用-4(%rbp)或者8(%rbp)訪問%rbp指針下面或者上面的元素。
在明白了這些之后,下面我們來看一個具體的例子:
- #include <stdio.h>
- int sum (int a,int b)
- {
- int c = a + b;
- return c;
- }
- int main()
- {
- int x = 5,y = 10,z = 0;
- z = sum(x,y);
- printf("%d\r\n",z);
- return 0;
- }
反匯編如下,下面我們就對照匯編代碼一步一步分析下函數調用過程中棧的變化。
- 0000000000000000 <sum>:
- 0: 55 push %rbp
- 1: 48 89 e5 mov %rsp,%rbp
- 4: 89 7d ec mov %edi,-0x14(%rbp) # 參數傳遞
- 7: 89 75 e8 mov %esi,-0x18(%rbp) # 參數傳遞
- a: 8b 55 ec mov -0x14(%rbp),%edx
- d: 8b 45 e8 mov -0x18(%rbp),%eax
- 10: 01 d0 add %edx,%eax
- 12: 89 45 fc mov %eax,-0x4(%rbp) # 局部變量
- 15: 8b 45 fc mov -0x4(%rbp),%eax # 存儲結果
- 18: 5d pop %rbp
- 19: c3 retq
- 000000000000001a <main>:
- 1a: 55 push %rbp # 保存%rbp。rbp,棧底的地址
- 1b: 48 89 e5 mov %rsp,%rbp # 設置新的棧指針。rsp 棧指針,指向棧頂的地址
- 1e: 48 83 ec 10 sub $0x10,%rsp # 分配 16字節棧空間。%rsp = %rsp-16
- 22: c7 45 f4 05 00 00 00 movl $0x5,-0xc(%rbp) # 賦值
- 29: c7 45 f8 0a 00 00 00 movl $0xa,-0x8(%rbp) # 賦值
- 30: c7 45 fc 00 00 00 00 movl $0x0,-0x4(%rbp) # 賦值
- 37: 8b 55 f8 mov -0x8(%rbp),%edx
- 3a: 8b 45 f4 mov -0xc(%rbp),%eax
- 3d: 89 d6 mov %edx,%esi # 參數傳遞 ,從右向左
- 3f: 89 c7 mov %eax,%edi # 參數傳遞
- 41: e8 00 00 00 00 callq 46 <main+0x2c> # 調用sum
- 46: 89 45 fc mov %eax,-0x4(%rbp)
- 49: 8b 45 fc mov -0x4(%rbp),%eax # 存儲計算結果
- 4c: 89 c6 mov %eax,%esi
- 4e: 48 8d 3d 00 00 00 00 lea 0x0(%rip),%rdi # 55 <main+0x3b>
- 55: b8 00 00 00 00 mov $0x0,%eax
- 5a: e8 00 00 00 00 callq 5f <main+0x45>
- 5f: b8 00 00 00 00 mov $0x0,%eax
- 64: c9 leaveq
- 65: c3 retq
函數調用前
在函數被調用之前,調用者會為調用函數做準備。首先,函數棧上開辟了16字節的空間,存儲定義的3個int型變量,建立了main函數的棧。
接著,會給三個變量進行賦值。
以下4行代碼是進行參數傳遞。我們可以看到是函數參數是倒序傳入的:先傳入第N個參數,再傳入第N-1個參數(CDECL約定)。
- mov -0x8(%rbp),%edx
- mov -0xc(%rbp),%eax
- mov %edx,%esi # 參數傳遞 ,從右向左
- mov %eax,%edi # 參數傳遞
最后,會執行到call指令處,調用sum函數。
- callq 46 <main+0x2c> # 調用sum
CALL指令內部其實還暗含了一個將返回地址(即CALL指令下一條指令的地址)壓棧的動作(由硬件完成)。
具體來說,call指令執行時,先把下一條指令的地址入棧,再跳轉到對應函數執行的起始處。
函數調用時
進入sum函數后,我們看到函數的前兩行:
- push %rbp
- mov %rsp,%rbp
這兩條匯編指令的含義是:首先將rbp寄存器入棧,然后將棧頂指針rsp賦值給rbp。
“mov rbp rsp”這條指令表面上看是用rsp覆蓋rbp原來的值,其實不然。
因為給rbp賦值之前,原rbp值已經被壓棧(位于棧頂),而新的rbp又恰恰指向棧頂。此時rbp寄存器就已經處于一個非常重要的地位。
該寄存器中存儲著棧中的一個地址(原rbp入棧后的棧頂),從該地址為基準,向上(棧底方向)能獲取返回地址、參數值,向下(棧頂方向)能獲取函數局部變量值,而該地址處又存儲著上一層函數調用時的rbp值。
一般而言,%rbp+4處為返回地址,%rbp+8處為第一個參數值(最后一個入棧的參數值,此處假設其占用4字節內存),%rbp-4處為第一個局部變量,%rbp處為上一層rbp值。
由于rbp中的地址處總是“上一層函數調用時的rbp值”,而在每一層函數調用中,都能通過當時的%rbp值“向上(棧底方向)”能獲取返回地址、參數值,“向下(棧頂方向)”能獲取函數局部變量值。
緊接著執行的四條指令。
- mov %edi,-0x14(%rbp) # 參數傳遞
- mov %esi,-0x18(%rbp) # 參數傳遞
- mov -0x14(%rbp),%edx
- mov -0x18(%rbp),%eax
- add %edx,%eax
- mov %eax,-0x4(%rbp)
上述指令通過rbp加偏移量的方式將main傳遞給sum的兩個參數保存在當前棧幀的合適位置,然后又取出來放入寄存器,看著有點兒多此一舉,這是因為在編譯時未給gcc指定優化級別,而gcc編譯程序時,默認不做任何優化,所以看起來比較啰嗦。
需要說明的是,sum的兩個參數和返回值都是int,在內存中只占4個字節,而圖中每個棧內存單元按8字節地址邊界進行了對齊,所以才是下圖中這個樣子。
再來看緊接著的三條指令。
- add %edx,%eax
- mov %eax,-0x4(%rbp) # 局部變量
- mov -0x4(%rbp),%eax # 存儲結果
上述第一條指令負責執行加法運算并將并將結果存入eax中,第二條指令將eax中的值存入局部變量c所在的內存,第三條指令將局部變量c的值讀取到eax中,可以看到,局部變量c被編譯器安排到了%rbp -0x4這個地址對應的內存中。
接下來繼續執行
- pop %rbp
- retq
這兩條指令的功能相當于下面的指令:
- mov %rbp,%rsp
- pop %rbp
- pop %rip
即在操作上面兩條指令的時候,首先把rsp賦值,它的值是存儲調用函數rbp的值的地址,所以可以通過出棧操作,來給rbp賦值,來找回調用函數的rbp。
通過棧的結構,可以知道,rbp上面就是調用函數調用被調用函數的下一條指令的執行地址,所以需要賦值給rip,來找回調用函數里的指令執行地址。
整個函數跳轉回main的時候,他的rsp,rbp都會變回原來的main函數的棧指針,C語言程序就是用這種方式來確保函數的調用之后,還能繼續執行原來的程序。
函數調用后
函數最后返回的時候,繼續執行下面這條指令:
- mov %eax,-0x4(%rbp) # 把sum函數的返回值賦給變量z
上述指令將eax中的結果放入rbp -0x4所指的內存中,這里也是main的局部變量z所在位置。
再往后的指令如下:
- mov %eax,-0x4(%rbp)
- mov -0x4(%rbp),%eax # 計算結果
- mov %eax,%esi
- mov %eax,%esi
- lea 0x0(%rip),%rdi
- mov $0x0,%eax
- callq 5f <main+0x45>
上述指令首先為printf準備參數,然后調用printf,具體過程和調用sum的過程相似,讓CPU直接執行到main倒數第二條leave指令處。
- mov $0x0,%eax
指令作用是將main返回值0放到寄存器eax,等main返回后調用main可拿到這個值。
執行leave指令相當于執行如下兩條指令:
- mov %rbp, %rsp
- pop %rbp
leave指令首先將rbp的值復制給rsp,rsp就指向rbp所指的棧單元。之后leave指令將該棧單元的值pop給rbp,如此,rsp和rbp就恢復成剛進入main時的狀態。