攜程面試官竟然問我 Java 虛擬機棧!
大家好,我是那個永遠 18 歲的老妖怪~噓
從《JVM 內存區域劃分》這篇文章中,大家應該 get 到了,Java 虛擬機內存區域可以劃分為程序計數器、Java 虛擬機棧、本地方法棧和堆。今天,我們來圍繞其中的一個區域——Java 虛擬機棧,深入地展開下。
先說明一下哈。這篇文章的標題里帶了一個“攜程面試官”,有標題黨的嫌疑。但有一說一,確實有讀者在上一篇文章里留言說,攜程面試官問他了 Java 虛擬機內存方面的知識點,所以今天的標題我就“借題發揮”了。
從“相見恨晚”這個詞中,我估摸著這名讀者在這道面試題前面折戟沉沙了。這么說吧,面試官確實喜歡問 Java 虛擬機方面的知識點,因為很能考察出一名應聘者的真實功底,所以我打算多寫幾篇這方面的文章,希望能給大家多一點點幫助~
Java 虛擬機以方法作為基本的執行單元,“棧幀(Stack Frame)”則是用于支持 Java 虛擬機進行方法調用和方法執行的基本數據結構。每一個棧幀中都包含了局部變量表、操作數棧、動態鏈接、方法返回地址和一些額外的附加信息(比如與調試、性能手機相關的信息)。之前的文章里有提到過這些概念,并做了一些簡單扼要的介紹,但我覺得還不夠詳細,所以這篇重點要來介紹一下棧幀中的這些概念。
1)局部變量表
局部變量表(Local Variables Table)用來保存方法中的局部變量,以及方法參數。當 Java 源代碼文件被編譯成 class 文件的時候,局部變量表的最大容量就已經確定了。
我們來看這樣一段代碼。
- public class LocalVaraiablesTable {
- private void write(int age) {
- String name = "沉默王二";
- }
- }
write() 方法有一個參數 age,一個局部變量 name。
然后用 Intellij IDEA 的 jclasslib 查看一下編譯后的字節碼文件 LocalVaraiablesTable.class。可以看到 write() 方法的 Code 屬性中,Maximum local variables(局部變量表的最大容量)的值為 3。
按理說,局部變量表的最大容量應該為 2 才對,一個 age,一個 name,為什么是 3 呢?
當一個成員方法(非靜態方法)被調用時,第 0 個變量其實是調用這個成員方法的對象引用,也就是那個大名鼎鼎的 this。調用方法 write(18),實際上是調用 write(this, 18)。
點開 Code 屬性,查看 LocalVaraiableTable 就可以看到詳細的信息了。
第 0 個是 this,類型為 LocalVaraiablesTable 對象;第 1 個是方法參數 age,類型為整形 int;第 2 個是方法內部的局部變量 name,類型為字符串 String。
當然了,局部變量表的大小并不是方法中所有局部變量的數量之和,它與變量的類型和變量的作用域有關。當一個局部變量的作用域結束了,它占用的局部變量表中的位置就被接下來的局部變量取代了。
來看下面這段代碼。
- public static void method() {
- // ①
- if (true) {
- // ②
- String name = "沉默王二";
- }
- // ③
- if(true) {
- // ④
- int age = 18;
- }
- // ⑤
- }
- method() 方法的局部變量表大小為 1,因為是靜態方法,所以不需要添加 this 作為局部變量表的第一個元素;
- ②的時候局部變量有一個 name,局部變量表的大小變為 1;
- ③的時候 name 變量的作用域結束;
- ④的時候局部變量有一個 age,局部變量表的大小為 1;
- ⑤的時候局 age 變量的作用域結束;
關于局部變量的作用域,《Effective Java》 中的第 57 條建議:
將局部變量的作用域最小化,可以增強代碼的可讀性和可維護性,并降低出錯的可能性。
在此,我還有一點要提醒大家。為了盡可能節省棧幀耗用的內存空間,局部變量表中的槽是可以重用的,就像 method() 方法演示的那樣,這就意味著,合理的作用域有助于提高程序的性能。
局部變量表的容量以槽(slot)為最小單位,一個槽可以容納一個 32 位的數據類型(比如說 int,當然了,《Java 虛擬機規范》中沒有明確指出一個槽應該占用的內存空間大小,但我認為這樣更容易理解),像 float 和 double 這種明確占用 64 位的數據類型會占用兩個緊挨著的槽。
來看下面的代碼。
- public void solt() {
- double d = 1.0;
- int i = 1;
- }
用 jclasslib 可以查看到,solt() 方法的 Maximum local variables 的值為 4。
為什么等于 4 呢?帶上 this 也就 3 個呀?
查看 LocalVaraiableTable 就明白了,變量 i 的下標為 3,也就意味著變量 d 占了兩個槽。
2)操作數棧
同局部變量表一樣,操作數棧(Operand Stack)的最大深度也在編譯的時候就確定了,被寫入到了 Code 屬性的 maximum stack size 中。當一個方法剛開始執行的時候,操作數棧是空的,在方法執行過程中,會有各種字節碼指令往操作數棧中寫入和取出數據,也就是入棧和出棧操作。
來看下面這段代碼。
- public class OperandStack {
- public void test() {
- add(1,2);
- }
- private int add(int a, int b) {
- return a + b;
- }
- }
OperandStack 類共有 2 個方法,test() 方法中調用了 add() 方法,傳遞了 2 個參數。用 jclasslib 可以看到,test() 方法的 maximum stack size 的值為 3。
這是因為調用成員方法的時候會將 this 和所有參數壓入棧中,調用完畢后 this 和參數都會一一出棧。通過 「Bytecode」 面板可以查看到對應的字節碼指令。
aload_0 用于將局部變量表中下標為 0 的引用類型的變量,也就是 this 加載到操作數棧中;
- iconst_1 用于將整數 1 加載到操作數棧中;
- iconst_2 用于將整數 2 加載到操作數棧中;
- invokevirtual 用于調用對象的成員方法;
- pop 用于將棧頂的值出棧;
- return 為 void 方法的返回指令。
再來看一下 add() 方法的字節碼指令。
- iload_1 用于將局部變量表中下標為 1 的 int 類型變量加載到操作數棧上(下標為 0 的是 this);
- iload_2 用于將局部變量表中下標為 2 的 int 類型變量加載到操作數棧上;
- iadd 用于 int 類型的加法運算;
- ireturn 為返回值為 int 的方法返回指令。
操作數中的數據類型必須與字節碼指令匹配,以上面的 iadd 指令為例,該指令只能用于整形數據的加法運算,它在執行的時候,棧頂的兩個數據必須是 int 類型的,不能出現一個 long 型和一個 double 型的數據進行 iadd 命令相加的情況。
3)動態鏈接
每個棧幀都包含了一個指向運行時常量池中該棧幀所屬方法的引用,持有這個引用是為了支持方法調用過程中的動態鏈接(Dynamic Linking)。
來看下面這段代碼。
- public class DynamicLinking {
- static abstract class Human {
- protected abstract void sayHello();
- }
- static class Man extends Human {
- @Override
- protected void sayHello() {
- System.out.println("男人哭吧哭吧不是罪");
- }
- }
- static class Woman extends Human {
- @Override
- protected void sayHello() {
- System.out.println("山下的女人是老虎");
- }
- }
- public static void main(String[] args) {
- Human man = new Man();
- Human woman = new Woman();
- man.sayHello();
- woman.sayHello();
- man = new Woman();
- man.sayHello();
- }
- }
大家對 Java 重寫有了解的話,應該能看懂這段代碼的意思。Man 類和 Woman 類繼承了 Human 類,并且重寫了 sayHello() 方法。來看一下運行結果:
- 男人哭吧哭吧不是罪
- 山下的女人是老虎
- 山下的女人是老虎
這個運行結果很好理解,man 的引用類型為 Human,但指向的是 Man 對象,woman 的引用類型也為 Human,但指向的是 Woman 對象;之后,man 又指向了新的 Woman 對象。
從面向對象編程的角度,從多態的角度,我們對運行結果是很好理解的,但站在 Java 虛擬機的角度,它是如何判斷 man 和 woman 該調用哪個方法的呢?
用 jclasslib 看一下 main 方法的字節碼指令。
- 第 1 行:new 指令創建了一個 Man 對象,并將對象的內存地址壓入棧中。
- 第 2 行:dup 指令將棧頂的值復制一份并壓入棧頂。因為接下來的指令 invokespecial 會消耗掉一個當前類的引用,所以需要復制一份。
- 第 3 行:invokespecial 指令用于調用構造方法進行初始化。
- 第 4 行:astore_1,Java 虛擬機從棧頂彈出 Man 對象的引用,然后將其存入下標為 1 局部變量 man 中。
- 第 5、6、7、8 行的指令和第 1、2、3、4 行類似,不同的是 Woman 對象。
- 第 9 行:aload_1 指令將第局部變量 man 壓入操作數棧中。
- 第 10 行:invokevirtual 指令調用對象的成員方法 sayHello(),注意此時的對象類型為 com/itwanger/jvm/DynamicLinking$Human。
- 第 11 行:aload_2 指令將第局部變量 woman 壓入操作數棧中。
- 第 12 行同第 10 行。
注意,從字節碼的角度來看,man.sayHello()(第 10 行)和 woman.sayHello()(第 12 行)的字節碼是完全相同的,但我們都知道,這兩句指令最終執行的目標方法并不相同。
究竟發生了什么呢?
還得從 invokevirtual 這個指令著手,看它是如何實現多態的。根據《Java 虛擬機規范》,invokevirtual 指令在運行時的解析過程可以分為以下幾步:
①、找到操作數棧頂的元素所指向的對象的實際類型,記作 C。
②、如果在類型 C 中找到與常量池中的描述符匹配的方法,則進行訪問權限校驗,如果通過則返回這個方法的直接引用,查找結束;否則返回 java.lang.IllegalAccessError 異常。
③、否則,按照繼承關系從下往上一次對 C 的各個父類進行第二步的搜索和驗證。
④、如果始終沒有找到合適的方法,則拋出 java.lang.AbstractMethodError 異常。
也就是說,invokevirtual 指令在第一步的時候就確定了運行時的實際類型,所以兩次調用中的 invokevirtual 指令并不是把常量池中方法的符號引用解析到直接引用上就結束了,還會根據方法接受者的實際類型來選擇方法版本,這個過程就是 Java 重寫的本質。我們把這種在運行期根據實際類型確定方法執行版本的過程稱為動態鏈接。
4)方法返回地址
當一個方法開始執行后,只有兩種方式可以退出這個方法:
正常退出,可能會有返回值傳遞給上層的方法調用者,方法是否有返回值以及返回值的類型根據方法返回的指令來決定,像之前提到的 ireturn 用于返回 int 類型,return 用于 void 方法;還有其他的一些,lreturn 用于 long 型,freturn 用于 float,dreturn 用于 double,areturn 用于引用類型。
異常退出,方法在執行的過程中遇到了異常,并且沒有得到妥善的處理,這種情況下,是不會給它的上層調用者返回任何值的。
無論是哪種方式退出,在方法退出后,都必須返回到方法最初被調用時的位置,程序才能繼續執行。一般來說,方法正常退出的時候,PC 計數器的值會作為返回地址,棧幀中很可能會保存這個計數器的值,異常退出時則不會。
方法退出的過程實際上等同于把當前棧幀出棧,因此接下來可能執行的操作有:恢復上層方法的局部變量表和操作數棧,把返回值(如果有的話)壓入調用者棧幀的操作數棧中,調整 PC 計數器的值,找到下一條要執行的指令等。
本文轉載自微信公眾號「沉默王二」,可以通過以下二維碼關注。轉載本文請聯系沉默王二公眾號。