騰訊三面:什么是 JVM 字節碼?它是如何工作的?
作為 Java程序員都知道 Java是跨平臺的語言,編譯一次到處運行,這得益于 JVM字節碼,這篇文章,我們將一起分析什么是JVM字節碼?如何查看 JVM字節碼?JVM字節碼是如何工作的?
什么 JVM 字節碼?
Java 源代碼經過編譯器編譯后,就會生成 JVM 字節碼,它是一種基于棧的低級、中立于平臺的指令架構,每個字節碼指令都會在 JVM 上執行一系列的操作,如加載、存儲、運算、跳轉等。它使用基于操作數棧和局部變量表的執行模型。
JVM 字節碼具有以下特點:
- 獨立于具體的硬件和操作系統,不同平臺上的 JVM 可以解釋和執行相同的字節碼文件。
- 相對于機器碼和源代碼,JVM 字節碼是一種更高級別的抽象,并且比機器碼更容易閱讀和編寫。
- JVM 字節碼通過運行時的即時編譯器或解釋器執行。
因此,只要在不同平臺上安裝相應的 JVM,就能在這些平臺上運行相同的字節碼,這種特性為 Java 程序提供了很高的可移植性和兼容性。值得注意的是,其他編程語言也可以編譯成 JVM 字節碼,利用 JVM 的優勢。這些編程語言叫做基于 JVM 的語言,例如 Kotlin、Groovy 等。
如何查看 JVM 字節碼?
通過 javap -c ClassName指令就可以查看 JVM字節碼,為了更好的說明,下面通過一個簡單的 Java程序和對應的 JVM字節碼示例來進行演示:
1.示例代碼
如下代碼,在控制臺輸出“Hello, World”:
public class HelloWorld {
public static void main(String[] args) {
System.out.println("Hello, World!");
}
}
使用 javac 命令編譯上述 Java 源代碼后會生成一個 HelloWorld.class 文件,然后使用javap -c HelloWorld命令查看字節碼,內容如下:
Compiled from "HelloWorld.java"
public class HelloWorld {
public HelloWorld();
Code:
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: return
public static void main(java.lang.String[]);
Code:
0: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream;
3: ldc #3 // String Hello, World!
5: invokevirtual #4 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
8: return
}
2.字節碼解釋
(1) 構造方法 HelloWorld()
- aload_0: 加載局部變量表中第一個變量(即this引用)。
- invokespecial #1: 調用父類(java/lang/Object)的構造方法。
- return: 從構造方法返回。
(2) main方法
- getstatic #2: 獲取靜態字段java/lang/System.out,它是一個 PrintStream 對象。
- ldc #3: 將常量池中索引為3的項(即字符串"Hello, World!")加載到操作數棧。
- invokevirtual #4: 調用 PrintStream 的 println 方法,參數是棧頂的字符串。
- return: 從main方法返回。
(3) 關鍵字節碼指令解析
- aload_0: 加載局部變量表中索引為 0的引用類型變量到操作數棧。
- invokespecial: 調用實例初始化方法和私有方法。
- getstatic: 獲取靜態字段的值并將其壓入操作數棧。
- ldc: 將常量池中的常量加載到操作數棧。
- invokevirtual: 調用對象的實例方法,方法的選擇是基于對象的運行時類型。
通過這個示例,我們可以看到 Java源代碼被編譯成 JVM 字節碼后是什么樣子。
JVM字節碼指令集
通過上述查看 JVM字節碼的示例,我們可以看到很多 JVM內部的指令,比如加載、存儲、運算、跳轉等。JVM字節碼指令集(Bytecode Instruction Set)是 JVM用來執行 Java 程序的指令集合,每條字節碼指令由一個字節的操作碼(opcode)和可選的操作數組成。
以下是 JVM 字節碼指令集的一些主要類別和具體指令:
1.加載和存儲指令
加載和存儲指令,全稱 Load and Store Instructions,包含以下幾個指令:
- aload: 從局部變量表加載引用類型變量到操作數棧。
- astore: 將操作數棧頂的引用類型變量存儲到局部變量表。
- iload: 從局部變量表加載整數類型變量到操作數棧。
- istore: 將操作數棧頂的整數類型變量存儲到局部變量表。
- dload, fload, lload: 加載雙精度浮點數、單精度浮點數和長整數類型變量。
- dstore, fstore, lstore: 存儲雙精度浮點數、單精度浮點數和長整數類型變量。
2.算術運算指令
算術運算指令,全稱 Arithmetic Instructions,包含以下幾個指令:
- iadd: 對棧頂的兩個整數進行加法運算。
- isub: 對棧頂的兩個整數進行減法運算。
- imul: 對棧頂的兩個整數進行乘法運算。
- idiv: 對棧頂的兩個整數進行除法運算。
- iinc: 對局部變量表中的整數變量進行自增。
- dadd, fadd, ladd: 加法運算(雙精度浮點數、單精度浮點數、長整數)。
- dsub, fsub, lsub: 減法運算(雙精度浮點數、單精度浮點數、長整數)。
3.類型轉換指令
類型轉換指令,全稱 Type Conversion Instructions,包含以下幾個指令:
- i2d: 整數轉雙精度浮點數。
- i2f: 整數轉單精度浮點數。
- i2l: 整數轉長整數。
- d2i, f2i, l2i: 轉換為整數。
4.對象操作指令
對象操作指令,全稱 Object Manipulation Instructions,包含以下幾個指令:
- new: 創建一個新的對象實例。
- newarray: 創建一個新的數組。
- anewarray: 創建一個新的引用類型數組。
- checkcast: 檢查對象是否為某一類型的實例。
- instanceof: 判斷對象是否是某一類型的實例。
5.方法調用和返回指令
方法調用和返回指令,全稱 Method Invocation and Return Instructions,包含以下幾個指令:
- invokestatic: 調用靜態方法。
- invokevirtual: 調用實例方法,根據對象的實際類型進行分派。
- invokespecial: 調用實例初始化方法、私有方法和父類方法。
- invokeinterface: 調用接口方法。
- return: 從方法返回(無返回值)。
- ireturn, dreturn, freturn, lreturn, areturn: 從方法返回(返回值為整數、雙精度浮點數、單精度浮點數、長整數、引用類型)。
6.控制流指令
控制流指令,全稱 Control Flow Instructions,包含以下幾個指令:
- goto: 無條件跳轉。
- ifeq: 如果棧頂整數為0,則跳轉。
- ifne: 如果棧頂整數不為0,則跳轉。
- iflt, ifge, ifgt, ifle: 比較棧頂整數,并根據結果跳轉。
- tableswitch: 用于switch語句的多路分支跳轉。
- lookupswitch: 用于switch語句的查找表跳轉。
7.異常處理指令
異常處理指令,全稱 Exception Handling Instructions,包含以下幾個指令:
- athrow: 拋出異常或錯誤。
- try-catch塊:通過異常表實現,不是具體的字節碼指令。
8.同步指令
同步指令,全稱 Synchronization Instructions,包含以下幾個指令:
- monitorenter: 獲取對象的監視器鎖。
- monitorexit: 釋放對象的監視器鎖。
9.棧操作指令
棧操作指令,全稱 Stack Operations Instructions,包含以下幾個指令:
- pop: 彈出棧頂的一個元素。
- dup: 復制棧頂的一個元素。
- swap: 交換棧頂的兩個元素。
JVM 如何執行字節碼?
JVM 字節碼的執行過程主要依賴于 Java 虛擬機的解釋器和即時編譯器(Just-In-Time Compiler,簡稱JIT)。JVM會將字節碼讀取到內存中,并逐條解釋執行,或者將熱點代碼編譯為機器碼來提高執行效率。
為了更好地說明 JVM 字節碼的執行過程,我們還是通過一個具體的示例來進行說明。
1.示例代碼
這里以 a + b 求和為例,代碼如下:
public class Sum {
public static int add(int a, int b) {
return a + b;
}
}
使用 javap -c Sum 命令獲取字節碼,具體信息如下:
Compiled from "Sum.java"
public class Sum {
public Sum();
Code:
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: return
public static int add(int, int);
Code:
0: iload_0
1: iload_1
2: iadd
3: ireturn
}
2.字節碼解釋
(1) 構造方法 Sum()
- aload_0: 加載局部變量表中第一個變量(即this引用)。
- invokespecial #1: 調用父類(java/lang/Object)的構造方法。
- return: 從構造方法返回。
(2) add()方法
- iload_0: 加載局部變量表中索引為0的整數(即參數a)到操作數棧。
- iload_1: 加載局部變量表中索引為1的整數(即參數b)到操作數棧。
- iadd: 彈出操作數棧頂的兩個整數,進行加法運算,并將結果壓入操作數棧。
- ireturn: 從方法返回,并將操作數棧頂的整數作為返回值。
3.執行過程
假設我們在另一個類中調用Sum.add(2, 3),執行過程如下:
- JVM將參數 2和 3壓入局部變量表,iload_0指令將參數 2加載到操作數棧。
- iload_1指令將參數 3加載到操作數棧。
- iadd指令彈出操作數棧頂的兩個值(2和3),進行加法運算,將結果5壓入操作數棧。
- ireturn指令將操作數棧頂的值(5)作為返回值返回給調用者。
總結
本文,我們分析了什么是JVM字節碼,如何查看JVM字節碼以及JVM如何執行字節碼,掌握這些底層不但可以幫助我們更好的理解,為什么 Java可以編譯一次,到處運行,還可以幫助我們更好的了解 Java的運行機制以及理解 Java的編程精髓。