深入理解Java虛擬機:程序計數器與虛擬機棧詳解
前言
本節主要講的是運行時數據區(程序計數器與虛擬機棧),也就是下圖這部分,它是在類加載完成后的階段:
圖片
- 每個線程:獨立包括程序計數器、棧、本地棧
- 線程間共享:堆、堆外內存(永久代或元空間、代碼緩存)
當我們通過前面的:類的加載-> 驗證 -> 準備 -> 解析 -> 初始化 這幾個階段完成后,就會用到執行引擎對我們的類進行使用,同時執行引擎將會使用到我們運行時數據區。
內存是非常重要的系統資源,是硬盤和CPU的中間倉庫及橋梁,承載著操作系統和應用程序的實時運行JVM內存布局規定了Java在運行過程中內存申請、分配、管理的策略,保證了JVM的高效穩定運行。不同的JVM對于內存的劃分方式和管理機制存在著部分差異。
正文
我們通過磁盤或者網絡IO得到的數據,都需要先加載到內存中,然后CPU從內存中獲取數據進行讀取,也就是說內存充當了CPU和磁盤之間的橋梁。
圖片
線程
線程是一個程序里的運行單元。JVM允許一個應用有多個線程并行的執行。在Hotspot JVM里,每個線程都與操作系統的本地線程直接映射。
當一個Java線程準備好執行以后,此時一個操作系統的本地線程也同時創建。Java線程執行終止后,本地線程也會回收。
操作系統負責所有線程的安排調度到任何一個可用的CPU上。一旦本地線程初始化成功,它就會調用Java線程中的run()方法。
JVM系統線程:
- 虛擬機線程:需要JVM達到安全點才會出現。這些操作必須在不同的線程中發生的,原因是他們都需要JVM達到安全點,這樣堆才不會變化。這種線程的執行類型包括stop-the-world的垃圾收集,線程棧收集,線程掛起以及偏向鎖撤銷。
- 周期任務線程:這種線程是時間周期事件的體現(比如中斷),他們一般用于周期性操作的調度執行。
- GC線程:這種線程對在JVM里不同種類的垃圾收集行為提供了支持。
- 編譯線程:這種線程在運行時會將字節碼編譯成到本地代碼。
- 信號調度線程:這種線程接收信號并發送給JVM,在它內部通過調用適當的方法進行處理。
程序計數器(PC寄存器)
圖片
- CPU只有把數據裝載到寄存器才能夠運行,JVM中的PC寄存器是對物理PC寄存器的一種抽象模擬。
- PC寄存器用來存儲指向下一條指令的地址,也即將要執行的指令代碼,由執行引擎讀取下一條指令。
案例
圖片
- 在JVM規范中,每個線程都有它自己的程序計數器,是線程私有的,生命周期與線程的生命周期保持一致。
- 任何時間一個線程都只有一個方法在執行(當前方法)。程序計數器會存儲當前線程正在執行的Java方法的JVM指令地址;如果是在執行native方法,則是未指定值(undefined)。
- 字節碼解釋器工作時就是通過改變這個計數器的值來選取下一條需要執行的字節碼指令。
虛擬機棧
由于跨平臺性的設計,Java的指令都是根據棧來設計的。不同平臺CPU架構不同,所以不能設計為基于寄存器的
每個線程在創建時都會創建一個虛擬機棧,其內部保存一個個的棧幀(Stack Frame),對應著一次次的Java方法調用,是線程私有的。
內存中的棧與堆
圖片
棧是運行時的單位,而堆是存儲的單位。
- 棧解決程序的運行問題,即程序如何執行,或者說如何處理數據。
- 堆解決的是數據存儲的問題,即數據怎么放,放哪里。
棧運行原理
- JVM直接對Java棧的操作只有兩個,就是對棧幀的壓棧和出棧,遵循先進后出/后進先出原則。
- 如果當前方法調用了其他方法,方法返回之際,當前棧幀會傳回此方法的執行結果給前一個棧幀,接著,虛擬機會丟棄當前棧幀,使得前一個棧幀重新成為當前棧幀。
棧幀內部結構
圖片
- 局部變量表是存放方法參數和局部變量的區域。局部變量沒有準備階段,必須顯式初始化。如果是非靜態方法,則在index[0]位置上存儲的是方法所屬對象的實例引用,一個引用變量占4個字節,隨后存儲的是參數和局部變量,32位以內的類型只占用一個slot(包括returnAddress類型),64位的類型(long和double)占用兩個slot。
- 操作數棧是個初始狀態為空的桶式結構棧。在方法執行過程中,會有各種指令往棧中寫入和提取信息。JVM 的執行引擎是基于棧的執行引擎,其中的棧指的就是操作數棧。字節碼指令集的定義都是基于棧類型的,棧的深度在方法元信息的stack屬性中。
- 動態連接是支持方法調用過程的動態連接,每個棧幀中包含一個在常量池中對當前方法的引用。
- 方法返回地址(Return Address)(或方法正常退出或者異常退出的定義)。
圖片
并行每個線程下的棧都是私有的,因此每個線程都有自己各自的棧,并且每個棧里面都有很多棧幀,棧幀的大小主要由局部變量表 和 操作數棧決定的。
案例
圖片
代碼跟蹤:
圖片
棧頂緩存技術
基于棧式架構的虛擬機所使用的零地址指令更加緊湊,但完成一項操作的時候必然需要使用更多的入棧和出棧指令,這同時也就意味著將需要更多的指令分派(instruction dispatch)次數和內存讀/寫次數。
由于操作數是存儲在內存中的,因此頻繁地執行內存讀/寫操作必然會影響執行速度。為了解決這個問題,HotSpot JVM的設計者們提出了棧頂緩存(Tos,Top-of-Stack Cashing)技術,將棧頂元素全部緩存在物理CPU的寄存器中,以此降低對內存的讀/寫次數,提升執行引擎的執行效率。
動態鏈接
每一個棧幀內部都包含一個指向運行時常量池中該棧幀所屬方法的引用,包含這個引用的目的就是為了支持當前方法的代碼能夠實現動態鏈接(Dynamic Linking)。比如:invokedynamic指令。
在Java源文件被編譯到字節碼文件中時,所有的變量和方法引用都作為符號引用(Symbolic Reference)保存在class文件的常量池里。比如:描述一個方法調用了另外的其他方法時,就是通過常量池中指向方法的符號引用來表示的,那么動態鏈接的作用就是為了將這些符號引用轉換為調用方法的直接引用。
方法的調用:解析與分配
在 JVM 中,將符號引用轉換為調用方法的直接引用與方法的綁定機制有關
- 靜態鏈接:當一個字節碼文件被裝載進 JVM 內部時,如果被調用的目標方法在編譯期可知,且運行期保持不變時。這種情況下將調用方法的符號引用轉換為直接引用的過程稱之為靜態鏈接
- 動態鏈接:如果被調用的方法在編譯期無法被確定下來,也就是說,只能在程序運行期將調用方法的符號引用轉換為直接引用,由于這種引用轉換過程具備動態性,因此也就被稱之為動態鏈接
對應的方法的綁定機制為:早期綁定(Early Binding)和晚期綁定(Late Binding)。綁定是一個字段、方法或者類在符號引用被替換為直接引用的過程,這僅僅發生一次
- 早期綁定就是指被調用的目標方法如果在編譯期可知,且運行期保持不變時,即可將這個方法與所屬的類型進行綁定,這樣一來,由于明確了被調用的目標方法究竟是哪一個,因此也就可以使用靜態鏈接的方式將符號引用轉換為直接引用。
- 如果被調用的方法在編譯期無法被確定下來,只能夠在程序運行期根據實際的類型綁定相關的方法,這種綁定方式也就被稱之為晚期綁定。
虛方法和非虛方法
- 如果方法在編譯期就確定了具體的調用版本,這個版本在運行時是不可變的,這樣的方法稱為非虛方法,比如靜態方法、私有方法、final方法、實例構造器、父類方法都是非虛方法
- 其他方法稱為虛方法。
方法的調用:虛方法表
在面向對象的編程中,會很頻繁的使用到動態分派,如果在每次動態分派的過程中都要重新在類的方法元數據中搜索合適的目標的話就可能影響到執行效率。
因此,為了提高性能,JVM采用在類的方法區建立一個虛方法表 (virtual method table)(非虛方法不會出現在表中)來實現,使用索引表來代替查找,每個類中都有一個虛方法表,表中存放著各個方法的實際入口。
虛方法表會在類加載的鏈接階段被創建并開始初始化,類的變量初始值準備完成之后,JVM會把該類的方法表也初始化完畢。
方法返回地址
執行引擎遇到任意一個方法返回的字節碼指令(return),會有返回值傳遞給上層的方法調用者,簡稱正常完成出口;
- 一個方法在正常調用完成之后,究竟需要使用哪一個返回指令,還需要根據方法返回值的實際數據類型而定。
- 在字節碼指令中,返回指令包含ireturn(當返回值是boolean,byte,char,short,int類型時使用),lreturn(Long類型),freturn(Float類型),dreturn(Double類型),areturn,另外還有一個return指令聲明為void的方法,實例初始化方法,類和接口的初始化方法使用。
在方法執行過程中遇到異常(Exception),并且這個異常沒有在方法內進行處理,也就是只要在本方法的異常表中沒有搜索到匹配的異常處理器,就會導致方法退出,簡稱異常完成出口。
附加信息
棧幀中還允許攜帶與Java虛擬機實現相關的一些附加信息。例如:對程序調試提供支持的信息。