深入理解Java虛擬機:方法區詳解
前言
本節主要講的是運行時數據區(方法區),也就是下圖這部分,它是在類加載完成后的階段:
圖片
- 每個線程:獨立包括程序計數器、棧、本地棧
- 線程間共享:堆、堆外內存(永久代或元空間、代碼緩存)
當我們通過前面的:類的加載-> 驗證 -> 準備 -> 解析 -> 初始化 這幾個階段完成后,就會用到執行引擎對我們的類進行使用,同時執行引擎將會使用到我們運行時數據區。
內存是非常重要的系統資源,是硬盤和CPU的中間倉庫及橋梁,承載著操作系統和應用程序的實時運行JVM內存布局規定了Java在運行過程中內存申請、分配、管理的策略,保證了JVM的高效穩定運行。不同的JVM對于內存的劃分方式和管理機制存在著部分差異。
正文
我們通過磁盤或者網絡IO得到的數據,都需要先加載到內存中,然后CPU從內存中獲取數據進行讀取,也就是說內存充當了CPU和磁盤之間的橋梁。
圖片
線程
線程是一個程序里的運行單元。JVM允許一個應用有多個線程并行的執行。在Hotspot JVM里,每個線程都與操作系統的本地線程直接映射。
當一個Java線程準備好執行以后,此時一個操作系統的本地線程也同時創建。Java線程執行終止后,本地線程也會回收。
操作系統負責所有線程的安排調度到任何一個可用的CPU上。一旦本地線程初始化成功,它就會調用Java線程中的run()方法。
JVM系統線程:
- 虛擬機線程:需要JVM達到安全點才會出現。這些操作必須在不同的線程中發生的,原因是他們都需要JVM達到安全點,這樣堆才不會變化。這種線程的執行類型包括stop-the-world的垃圾收集,線程棧收集,線程掛起以及偏向鎖撤銷。
- 周期任務線程:這種線程是時間周期事件的體現(比如中斷),他們一般用于周期性操作的調度執行。
- GC線程:這種線程對在JVM里不同種類的垃圾收集行為提供了支持。
- 編譯線程:這種線程在運行時會將字節碼編譯成到本地代碼。
- 信號調度線程:這種線程接收信號并發送給JVM,在它內部通過調用適當的方法進行處理。
方法區
棧、堆、方法區的交互關系
圖片
盡管所有的方法區在邏輯上是屬于堆的一部分,但一些簡單的實現可能不會選擇去進行垃圾收集或者進行壓縮。但對于HotSpotJVM而言,方法區還有一個別名叫做Non-Heap(非堆),目的就是要和堆分開,所以方法區看作是一塊獨立于Java堆的內存空間。
方法區基本理解
- 方法區(Method Area)與Java堆一樣,是各個線程共享的內存區域。
- 方法區在JVM啟動的時候被創建,并且它的實際的物理內存空間中和Java堆區一樣都可以是不連續的。
- 方法區的大小,跟堆空間一樣,可以選擇固定大小或者可擴展。
- 方法區的大小決定了系統可以保存多少個類,如果系統定義了太多的類,導致方法區溢出,虛擬機同樣會拋出內存溢出錯誤:java.lang.OutOfMemoryError: PermGen space 或者java.lang.OutOfMemoryError: Metaspace
- 加載大量的第三方的jar包;Tomcat部署的工程過多(30~50個);大量動態的生成反射類
- 關閉JVM就會釋放這個區域的內存。
方法區的演進
在jdk7及以前,習慣上把方法區,稱為永久代。jdk8開始,使用元空間取代了永久代
圖片
JDK8完全廢棄了永久代的概念,改用與JRockit、J9一樣在本地內存中實現的元空間(Metaspace)來代替
圖片
元空間的本質和永久代類似,都是對JVM規范中方法區的實現。不過元空間與永久代最大的區別在于:元空間不在虛擬機設置的內存中,而是使用本地內存。
設置方法區內存的大小
jdk7及以前:
- 通過-XX:Permsize來設置永久代初始分配空間。默認值是20.75M
- 通過-XX:MaxPermsize來設定永久代最大可分配空間。32位機器默認是64M,64位機器模式是82M
圖片
jdk8及以后:
- 元數據區大小可以使用參數 -XX:MetaspaceSize 和 -XX:MaxMetaspaceSize指定
- -XX:MetaspaceSize設置初始的元空間大小。對于一個64位的服務器端JVM來說,其默認的-XX:MetaspaceSize值為21MB,這就是初始的高水位線,一旦觸及這個水位線,Full GC將會被觸發并卸載沒用的類(即這些類對應的類加載器不再存活),然后這個高水位線將會重置。新的高水位線的值取決于GC后釋放了多少元空間。如果釋放的空間不足,那么在不超過MaxMetaspaceSize時,適當提高該值。如果釋放空間過多,則適當降低該值。
方法區的內部結構
圖片
方法區存儲什么
它用于存儲已被虛擬機加載的類型信息、常量、靜態變量、即時編譯器編譯后的代碼緩存等
圖片
類型信息,對每個加載的類型(類class、接口interface、枚舉enum、注解annotation),JVM必須在方法區中存儲以下類型信息:
- 這個類型的完整有效名稱(全名=包名.類名)
- 這個類型直接父類的完整有效名(對于interface或java.lang.Object,都沒有父類)
- 這個類型的修飾符(public,abstract,final的某個子集)
- 這個類型直接接口的一個有序列表
域信息,JVM必須在方法區中保存類型的所有域的相關信息以及域的聲明順序:
- 域的相關信息包括:域名稱、域類型、域修飾符(public,private,protected,static,final,volatile,transient的某個子集)
方法信息,JVM必須保存所有方法的以下信息,同域信息一樣包括聲明順序:
- 方法名稱
- 方法的返回類型(或void)
- 方法參數的數量和類型(按順序)
- 方法的修飾符(public,private,protected,static,final,synchronized,native,abstract的一個子集)
- 方法的字節碼(bytecodes)、操作數棧、局部變量表及大小(abstract和native方法除外)
- 異常表(abstract和native方法除外)
每個異常處理的開始位置、結束位置、代碼處理在程序計數器中的偏移地址、被捕獲的異常類的常量池索引
類變量:
- 靜態變量和類關聯在一起,隨著類的加載而加載,他們成為類數據在邏輯上的一部分
- 類變量被類的所有實例共享,即使沒有類實例時,你也可以訪問它
全局常量:
- 被聲明為final的類變量的處理方法則不同,每個全局常量在編譯的時候就會被分配了
常量池
- 字節碼文件,內部包含了常量池(數量值、字符串值、類引用、字段引用、方法引用)
圖片
一個有效的字節碼文件中除了包含類的版本信息、字段、方法以及接口等描述符信息外,還包含一項信息就是常量池表(Constant Pool Table),包括各種字面量和對類型、域和方法的符號引用。
一個Java源文件中的類、接口,編譯后產生一個字節碼文件。而Java中的字節碼需要數據支持,通常這種數據會很大以至于不能直接存到字節碼里,換另一種方式,可以存到常量池,這個字節碼包含了指向常量池的引用,在動態鏈接的時候會用到運行時常量池。
常量池可以看做是一張表,虛擬機指令根據這張常量表找到要執行的類名、方法名、參數類型、字面量等類型。
運行時常量池
- 運行時常量池是方法區的一部分。
- 常量池表是Class文件的一部分,用于存放編譯期生成的各種字面量與符號引用,這部分內容將在類加載后存放到方法區的運行時常量池中。
- 運行時常量池,在加載類和接口到虛擬機后,就會創建對應的運行時常量池。
- JVM為每個已加載的類型(類或接口)都維護一個常量池。池中的數據項像數組項一樣,是通過索引訪問的。
- 運行時常量池中包含多種不同的常量,包括編譯期就已經明確的數值字面量,也包括到運行期解析后才能夠獲得的方法或者字段引用。此時不再是常量池中的符號地址了,這里換為真實地址。
- 運行時常量池,相對于Class文件常量池的另一重要特征是:具備動態性。
- 運行時常量池類似于傳統編程語言中的符號表(symboltable),但是它所包含的數據卻比符號表要更加豐富一些。
- 當創建類或接口的運行時常量池時,如果構造運行時常量池所需的內存空間超過了方法區所能提供的最大值,則JVM會拋OutOfMemoryError異常。
方法區使用舉例
public class MethodAreaDemo {
public static void main(String args[]) {
int x = 500;
int y = 100;
int a = x / y;
int b = 50;
System.out.println(a+b);
}
}
圖片
詳細執行過程
圖片
圖片
圖片
圖片
圖片
圖片
圖片
圖片
圖片
圖片
圖片
圖片
圖片
圖片
圖片
圖片
方法區的演進細節
jdk1.6:
圖片
jdk1.7:
圖片
jdk1.8:
圖片
StringTable為什么要調整位置
jdk7中將StringTable放到了堆空間中。因為永久代的回收效率很低,在full gc的時候才會觸發。而full gc是老年代的空間不足、永久代不足時才會觸發。
這就導致StringTable回收效率不高。而我們開發中會有大量的字符串被創建,回收效率低,導致永久代內存不足。放到堆里,能及時回收內存。