JVM 架構—JVM 內部是如何工作的?
什么是虛擬機?
JVM(Java Virtual Machine):它是一個引擎,為Java應用程序提供運行時環境,并負責轉換通過編譯(.java文件)生成的字節碼(.class文件)。JVM 是 Java 運行時環境 (JRE) 的一部分。
Java 應用程序稱為 WORA(Write Once Run Anywhere)。這意味著程序員可以在一個系統上開發 Java 代碼,并且可以期望它無需任何調整就可以在任何其他支持 Java 的系統上運行。由于 JVM,這一切都是可能的。
JVM 架構:
JVM分為三個主要的子系統:
- 類加載器
- 運行時數據區(內存區)
- 執行引擎
1、類加載器:
ClassLoader 是 Java 運行時環境 (JRE) 的一部分,可將 Java 類文件從文件系統、網絡或任何其他來源動態加載到 Java 虛擬機中。它分為三個主要階段:
- 加載中
- 鏈接
- 初始化
(1)加載:
是負責從各種資源(例如文件系統、jar 文件、網絡套接字)將字節代碼(.class 文件)加載到內存中的部分。
Load階段涉及三種不同類型的ClassLoader:
- Bootstrap Class Loader: 它加載 JDK 內部類。它加載rt.jar和其他核心類,例如 java.lang.* 包類。
- 擴展類加載器: 它從 JDK 擴展目錄加載類,通常是$JAVA_HOME/lib/ext目錄。
- 應用程序類加載器: 它從當前類路徑加載類。我們可以在使用 -cp 或 -classpath 命令行選項調用程序時設置類路徑。
ClassLoader 在 Java 中是如何工作的
當JVM 請求一個類時,它通過傳遞類的完全分類名稱來調用java.lang.ClassLoader 類的loadClass() 方法。loadClass() 方法調用 findLoadedClass() 方法來檢查該類是否已經加載。需要避免多次加載類。
如果該類未加載,它將請求委托給父 ClassLoader 以加載該類。如果 ClassLoader 沒有找到類,它會調用 findClass() 方法在文件系統中查找類。下圖顯示了 ClassLoader 如何使用委托在 Java 中加載類。
假設我們有一個特定于應用程序的類 Student.class。加載此類文件的請求將傳輸到 Application ClassLoader。它委托給它的父擴展類加載器。此外,它委托給 Bootstrap ClassLoader。Bootstrap 在 rt.jar 中搜索該類,因為該類不存在。現在請求傳輸到 Extension ClassLoader,它搜索目錄 jre/lib/ext 并嘗試在其中找到此類。如果在此處找到該類,Extension ClassLoader 將加載該類。Application ClassLoader 從不加載該類。當擴展 ClassLoader 不加載它時,Application ClaasLoader 從 Java 中的 CLASSPATH 加載它。
可見性原則是說子ClassLoader可以看到父ClassLoader加載的類,反之則不然。這意味著如果 Application ClassLoader 加載 Student.class,在這種情況下,嘗試使用 Extension ClassLoader 顯式加載 Student.class 會拋出
java.lang.ClassNotFoundException。
(2)鏈接:
主要分為三個階段:
- 驗證:它確保.class文件(字節碼)的正確性 ,即它檢查此文件是否正確格式化并由有效的編譯器生成,以及是否與 JVM 類規范兼容。如果驗證失敗,我們會得到運行時異常 java.lang.VerifyError。此活動由組件ByteCodeVerifier完成。完成此活動后,類文件就可以編譯了。
- 準備:準備包括為類或接口創建靜態字段并將這些字段初始化為其默認值。這不需要執行任何 Java 虛擬機代碼;靜態字段的顯式初始化程序作為初始化的一部分而不是準備執行。
- Resolution:是從運行時常量池中的符號引用動態確定具體值的過程。
JVM 指令 anewarray、checkcast、getfield、getstatic、instanceof、invokedynamic、invokeinterface、invokespecial、invokestatic、invokevirtual、ldc、ldc_w、multiawarray、new、putfield 和 putstatic 對運行時常量池進行符號引用 。執行這些指令中的任何一條都需要解析其符號引用。
(3)初始化:
這是類加載的最后階段,這里所有的靜態變量都將被賦予原始值,并執行靜態塊。
2、運行時數據區:
(1)方法區(Method Area):
Java 虛擬機有一個 在所有 Java 虛擬機線程之間共享的方法區。方法區類似于常規語言的編譯代碼的存儲區,或者類似于操作系統進程中的“文本”段。它存儲每個類的結構,例如運行時常量池、字段和方法數據,以及方法和構造函數的代碼,包括類和實例初始化以及接口初始化中使用的特殊方法。
- 如果方法區中的內存無法滿足分配請求,Java 虛擬機將拋出 OutOfMemoryError。
(2)堆(Heap):
Java 虛擬機有一個 在所有 Java 虛擬機線程之間共享的堆。堆是運行時數據區域,從中分配所有類實例和數組的內存。
堆是在虛擬機啟動時創建的。對象的堆存儲由自動存儲管理系統(稱為 垃圾收集器)回收;對象永遠不會顯式釋放。Java 虛擬機沒有假定特定類型的自動存儲管理系統,可以根據實現者的系統要求選擇存儲管理技術。堆可以是固定大小的,也可以根據計算的需要進行擴展,如果不需要更大的堆,則可以收縮。堆的內存不需要是連續的。
Java 虛擬機實現可以讓程序員或用戶控制堆的初始大小,如果堆可以動態擴展或收縮,還可以控制最大和最小堆大小。
以下異常情況與堆相關聯:
- 如果計算需要的堆多于自動存儲管理系統所能提供的堆,則 Java 虛擬機將拋出 OutOfMemoryError。
(3)堆棧(Stack):
每個 Java 虛擬機線程都有一個私有的 Java 虛擬機堆棧,與線程同時創建。Java 虛擬機堆棧存儲幀。Java 虛擬機堆棧類似于 C 等常規語言的堆棧:它保存局部變量和部分結果,并在方法調用和返回中發揮作用。因為 Java 虛擬機堆棧從不直接操作,除了壓入和彈出幀外,幀可能是堆分配的。Java 虛擬機堆棧的內存不需要是連續的。
在The Java? Virtual Machine Specification第一版中 ,Java 虛擬機堆棧被稱為 Java 堆棧。
此規范允許 Java 虛擬機堆棧具有固定大小或根據計算需要動態擴展和收縮。如果 Java 虛擬機堆棧的大小是固定的,則每個 Java 虛擬機堆棧的大小可以在創建該堆棧時獨立選擇。
Java 虛擬機實現可以為程序員或用戶提供對 Java 虛擬機堆棧初始大小的控制,以及在動態擴展或收縮 Java 虛擬機堆棧的情況下,對最大和最小大小的控制。
以下異常情況與 Java 虛擬機堆棧相關:
- 如果線程中的計算需要比允許的更大的 Java 虛擬機堆棧,Java 虛擬機將拋出 StackOverflowError。
- 如果 Java 虛擬機堆棧可以動態擴展,并且嘗試擴展但沒有足夠的內存可用于實現擴展,或者如果沒有足夠的內存可用于為新線程創建初始 Java 虛擬機堆棧,則 Java 虛擬機機器拋出 OutOfMemoryError。
(4)PC注冊(PC Register):
它存儲當前執行的指令的地址。
(5)原生方法棧(Native Method Stack):
Native Method Stack 保存本地方法信息。對于每個線程,都會創建一個單獨的本機方法堆棧。
3、執行引擎:
執行引擎通過執行每個類中存在的代碼來處理此問題。但是,在執行程序之前,需要將字節碼轉換為機器語言指令。JVM 可以使用解釋器或 JIT 編譯器作為執行引擎。
它可以分為三個部分:
解釋器:解釋器逐行讀取并執行字節碼指令。由于逐行執行,解釋器相對較慢。
解釋器的另一個缺點是當一個方法被多次調用時,每次都需要重新解釋。
即時編譯器(JIT) :用于提高解釋器的效率。它編譯整個字節碼并將其更改為本地代碼,因此每當解釋器看到重復的方法調用時,JIT 會為該部分提供直接的本地代碼,因此不需要重新解釋,從而提高了效率。
垃圾收集器:它銷毀未引用的對象。有關垃圾收集器的更多信息,請參閱 Java Garbage Collection Basics。
Java 本機接口 (JNI):
它是一個與本地方法庫交互并提供執行所需的本地庫(C、C++)的接口。它使 JVM 能夠調用 C/C++ 庫,并被可能特定于硬件的 C/C++ 庫調用。
本機方法庫:
它是執行引擎所需的本機庫(C、C++)的集合。