面試必問的 JVM 運行時數據區,你懂了嗎?
前言
Java 虛擬機的運行時數據區經常在面試中被拿來提問,很多概念在市面上有各種各樣的說法,搞的不少同學應該是懵逼的。
當我們陷入不知道哪個說法是正確的情況時,最好的參考就是源碼和規范。
在面試中,當面試官反問你:為什么某某是這樣?的時候,如果你回答:因為規范是這么寫的、因為源碼是這么寫的。
這個回答是非常有說服力的。
因此,本文在描述一些有爭議的問題上,優先以《Java 虛擬機規范》的說法為準。
正文
1、運行時數據區(Run-Time Data Areas)
Java 虛擬機定義了若干種在程序執行期間會使用到的運行時數據區域。
其中一些數據區域在 Java 虛擬機啟動時被創建,隨著虛擬機退出而銷毀。也就是線程間共享的區域:堆、方法區、運行時常量池。
另外一些數據區域是按線程劃分的,這些數據區域在線程創建時創建,在線程退出時銷毀。也就是線程間隔離的區域:程序計數器、Java虛擬機棧、本地方法棧。
1)程序計數器(Program Counter Register)
Java 虛擬機可以支持多個線程同時執行,每個線程都有自己的程序計數器。在任何時刻,每個線程都只會執行一個方法的代碼,這個方法稱為該線程的當前方法(current method)。
如果線程正在執行的是 Java 方法(不是 native 的),則程序計數器記錄的是正在執行的 Java 虛擬機字節碼指令的地址。如果正在執行的是本地(native)方法,那么計數器的值是空的(undefined)。
2)Java虛擬機棧(Java Virtual Machine Stacks)
每個 Java 虛擬機線程都有自己私有的 Java 虛擬機棧,它與線程同時創建,用于存儲棧幀。
Java 虛擬機棧描述的是 Java 方法執行的內存模型:每個方法在執行的同時都會創建一個棧幀用于存儲局部變量表、操作數棧、動態鏈接、方法出口等信息。
每一個方法從調用直至執行完成的過程,就對應著一個棧幀在虛擬機棧中入棧到出棧的過程。
3)本地方法棧(Native Method Stacks)
本地方法棧與 Java 虛擬機棧所發揮的作用是非常相似的,它們之間的區別不過是 Java 虛擬機棧為虛擬機執行 Java方法(也就是字節碼)服務,而本地方法棧則為虛擬機使用到的本地(Native)方法服務。
4)堆(Heap)
堆是被各個線程共享的運行時內存區域,也是供所有類實例和數組對象分配內存的區域。
堆在虛擬機啟動時創建,堆存儲的對象不會被顯示釋放,而是由垃圾收集器進行統一管理和回收。
5)方法區(Method Area)
方法區是被各個線程共享的運行時內存區域。方法區類似于傳統語言的編譯代碼的存儲區。它存儲了每一個類的結構信息,例如:運行時常量池、字段和方法數據,構造函數和普通方法的字節碼內容,還包括一些用于類、實例、接口初始化用到的特殊方法。
6)運行時常量池(Run-Time Constant Pool)
運行時常量池是 class 文件中每一個類或接口的常量池表(constant_pool table)的運行時表示形式。
它包含了若干種常量,從編譯時已知的數值字面量到必須在運行時解析后才能獲得的方法和字段引用。運行時常量池的功能類似于傳統編程語言的符號表(symbol table),不過它包含的數據范圍比通常意義上的符號表要更為廣泛。
2、Java 中有哪幾種常量池?
現在我們經常提到的常量池主要有三種:class 文件常量池、運行時常量池、字符串常量池。
3、class 文件常量池
class 文件常量池(class constant pool)屬于 class 文件的其中一項,class 類文件包含:魔數、類的版本、常量池、訪問標志、字段表集合、方發表等信息。
常量池用于存放編譯期間生成的各種字面量(Literal)和符號引用(Symbolic References)。
字面量比較接近于Java語言層面的常量概念,如文本字符串、聲明為 final 的常量值等。
符號引用則屬于編譯原理方面的概念。符號引用是一組符號來描述所引用的目標,符號可以是任何形式的字面量,只要使用時能無歧義地定位到目標即可(它與直接引用區分,直接引用一般是指向方法區的本地指針,相對偏移量或是一個能間接定位到目標的句柄)。符號引用主要包括下面幾類常量:
- 被模塊導出或開放的包(Package)
- 類和接口的全限定名(Fully Qualified Name)
- 字段的名稱和描述符(Descriptor)
常量池中每一項常量都是一個表,截至JDK 13,常量表中分別有17種不同類型的常量。17種常量類型所代表的具體含義如圖所示。
關于 class 文件常量池的更多內容可以閱讀周志明的《深入理解Java虛擬機》6.3.2 章節。
4、運行時常量池
class 文件常量池是在類被編譯成 class 文件時生成的。而當類被加載到內存中后,JVM 就會將 class 文件常量池中的內容存放到運行時常量池中。
Java 虛擬機規范中對運行時常量池的定義如下:
A run-time constant pool is a per-class or per-interface run-time representation of the constant_pool table in a class file.
運行時常量池是 class 文件中每一個類或接口的常量池表(constant_pool table)的運行時表示形式。
因此,根據規范定義,可以說運行時常量池是 class 文件常量池的運行時表示,每個類在運行時都有自己的一個獨立的運行時常量池。
5、字符串常量池
簡單來說,HotSpot VM 里的字符串常量池(StringTable)是個哈希表,全局只有一份,被所有的類共享。
StringTable 具體存儲的是 String 對象的引用,而不是 String 對象實例自身。String 對象實例在 JDK 6 及之前是在永久代里,從JDK 7 開始放在堆里。
根據 Java 虛擬機規范的定義,堆是存儲 Java 對象的地方,其他地方是不會有 Java 對象實體的,如果有的話,根據規范定義,這些地方也要算堆的一部分。
6、字符串常量池是否屬于方法區?
我認為是不屬于的。
在讀本文之前,我相信很多同學會有如下觀點:因為運行時常量池屬于方法區,所以很多同學認為字符串常量池也應該屬于方法區。
但是相信看了上面的內容后,會開始意識到,運行時常量池和字符串常量池其實是不同的兩個東西,當然它們在字符串解析時會有關聯。
Java 虛擬機規范中對方法區的定義如下:
The Java Virtual Machine has a method area that is shared among all Java Virtual Machine threads. The method area is analogous to the storage area for compiled code of a conventional language or analogous to the "text" segment in an operating system process. It stores per-class structures such as the run-time constant pool, field and method data, and the code for methods and constructors, including the special methods (§2.9) used in class and instance initialization and interface initialization
在 Java 虛擬機中,方法區是被各個線程共享的運行時內存區域。方法區類似于傳統語言的編譯代碼的存儲區,或者類似于操作系統進程中的文本段。它存儲了每一個類的結構信息,例如:運行時常量池、字段和方法數據,構造函數和普通方法的字節碼內容,還包括一些用于類、實例、接口初始化用到的特殊方法。
這邊的關鍵在于 “它存儲了每一個類的結構信息”,而字符串常量池并不屬于某個類,字符串常量是全局共享的,因此,根據規范定義,我們可以說字符串常量池不屬于方法區。
那字符串常量池(StringTable)究竟存在哪里了?
StringTable 本體是存儲在 native memory(本地內存)里,不是在永久代里,不是在方法區里,當然,更不是在堆里。
7、運行時常量池和字符串常量池的關聯?
上面說了,運行時常量池和字符串常量池在字符串解析時會有關聯,具體如下。
類的運行時常量池中有 CONSTANT_String_info(見題3表格)類型的常量,CONSTANT_String_info 類型的常量的解析(resolve)過程如下:
首先到字符串常量池(StringTable)中查找是否已經有了該字符串的引用,如果有,則直接返回字符串常量池的引用;如果沒有,則在堆中創建 String 對象,并在字符串常量池駐留其引用,然后返回該引用。
也就說,運行時常量池里的 CONSTANT_String_info 類型的常量,經過解析(resolve)之后,同樣存的是字符串的引用,并且和 StringTable 駐留的引用的是一致的。
8、String#intern 方法
在 JDK 7 及之后的版本中,該方法的作用如下:如果字符串常量池中已經有這個字符串,則直接返回常量池中的引用;如果沒有,則將這個字符串的引用保存一份到字符串常量池,然后返回這個引用。
下面的例子可以進行簡單的驗證:
- public static void main(String args[]) {
- // 創建2個對象,str持有的是new創建的對象引用
- // 1)駐留(intern)在字符串常量池中的對象
- // 2)new創建的對象
- String str = new String("joonwhee");
- // 字符串常量池中已經有了,返回字符串常量池中的引用
- String str2 = "joonwhee";
- // false,str為new創建的對象引用,str2為字符創常量池中的引用
- System.out.println(str == str2);
- // str修改為字符串常量池的引用,所以下面為true
- str = str.intern();
- // true
- System.out.println(str == str2);
- }
9、永久代(PermGen)
永久代在 Java 8 被移除。根據官方提案的描述,移除的主要動機是:要將 JRockit 和 Hotspot 進行融合,而 JRockit 并沒有永久代。
而據我們所了解的,還有另外一個重要原因是永久代本身也存在較多的問題,經常出現OOM,還出過不少bug。
根據官方提案的描述,永久代主要存儲了三種數據:
1)Class metadata(類元數據),也就是方法區中包含的數據,除了編譯生成的字節碼被放在 native memory(本地內存)。
2)interned Strings,也就是字符串常量池中駐留引用的字符串對象,字符串常量池只駐留引用,而實際對象是在永久代中。
3)class static variables,類靜態變量。
移除永久代后,interned Strings 和 class static variables 被移動了堆中,Class metadata 被移動到了后來的元空間。
10、永久代和方法區的關系?
方法區是 Java 虛擬機規范中定義的一種邏輯概念,而永久代是對方法區的實現。但是永久代并不等同于方法區,方法區也不等同于永久代。
永久代中的 interned Strings 并不屬于方法區,按規范:堆是存儲 Java 對象的地方 ,這部分應該屬于堆,因此永久代并不是只用于實現方法區。
方法區中 JIT 編譯生成的代碼并不是存放在永久代,而是在 native memory 中,因此可以說方法區也并不只是由永久代來實現。
11、元空間(metaspace)
元空間在 Java 8 移除永久代后被引入,用來代替永久代,本質和永久代類似,都是對方法區的實現。不過元空間與永久代之間最大的區別在于:元空間并不在虛擬機中,而是使用本地內存(native memory)。
元空間主要用于存儲 Class metadata(類元數據),根據其命名其實也看得出來。
可以通過 -XX:MaxMetaspaceSize 參數來限制元空間的大小,如果沒有設置該參數,則元空間默認限制為機器內存。
12、為什么引入元空間?
在 Java 8 之前,Java 虛擬機使用永久代來存放類元信息,通過-XX:PermSize、-XX:MaxPermSize 來控制這塊內存的大小,隨著動態類加載的情況越來越多,這塊內存變得不太可控,到底設置多大合適是每個開發者要考慮的問題。
如果設置小了,容易出現內存溢出;如果設置大了,又有點浪費,盡管不會實質分配這么大的物理內存。
而元空間可以較好的解決內存設置多大的問題:當我們沒有指定 -XX:MaxMetaspaceSize 時,元空間可以動態的調整使用的內存大小,以容納不斷增加的類。
13、元空間能徹底解決內存溢出(Out Of Memory)問題嗎?
很遺憾,答案是不行的。
元空間無法徹底解決內存溢出的問題,只能說是有所緩解。當內存使用完畢后,元空間一樣會出現內存溢出的情況,最典型的場景就是出現了內存泄漏時。
本文轉載自微信公眾號「程序員囧輝」,可以通過以下二維碼關注。轉載本文請聯系程序員囧輝公眾號。