深入理解多線程(二)—— Java的對象模型
上一篇文章中簡單介紹過synchronized關鍵字的方式,其中,同步代碼塊使用monitorenter和monitorexit兩個指令實現,同步方法使用ACC_SYNCHRONIZED標記符實現。后面幾篇文章會從JVM源碼的角度更加深入,層層剝開synchronized的面紗。
在進入正題之前,肯定有些基礎知識需要鋪墊,那么先來看一下一個容易被忽略的但是又很重要的知識點 —— Java對象模型 。
大家都知道的是,Java對象保存在堆內存中。在內存中,一個Java對象包含三部分:對象頭、實例數據和對齊填充。其中對象頭是一個很關鍵的部分,因為對象頭中包含鎖狀態標志、線程持有的鎖等標志。這篇文章就主要從Java對象模型入手,找一找我們關系的對象頭以及對象頭中和鎖相關的運行時數據在JVM中是如何表示的。
Java的對象模型
任何一個接觸過Java的人都知道,Java是一種面向對象語言。在學習Java的過程中你一定對下面兩句話不陌生:
1、在面向對象的軟件中,對象(Object)是某一個類(Class)的實例。
2、一切皆對象
我們還知道,在JVM的內存結構中,對象保存在堆內存中,而我們在對對象進行操作時,其實操作的是對象的引用。那么對象本身在JVM中的結構是什么樣的呢?本文的所有分析均基于HotSpot虛擬機。
oop-klass model
HotSpot是基于c++實現,而c++是一門面向對象的語言,本身是具備面向對象基本特征的,所以Java中的對象表示,最簡單的做法是為每個Java類生成一個c++類與之對應。但HotSpot JVM并沒有這么做,而是設計了一個OOP-Klass Model。OOP(Ordinary Object Pointer)指的是普通對象指針,而Klass用來描述對象實例的具體類型。
為什么HotSpot要設計一套oop-klass model呢?答案是:HotSopt JVM的設計者不想讓每個對象中都含有一個vtable(虛函數表)
這個解釋似乎可以說得通。眾所周知,C++和Java都是面向對象的語言,面向對象語言有一個很重要的特性就是多態。關于多態的實現,C++和Java有著本質的區別。
- 多態是面向對象的最主要的特性之一,是一種方法的動態綁定,實現運行時的類型決定對象的行為。多態的表現形式是父類指針或引用指向子類對象,在這個指針上調用的方法使用子類的實現版本。多態是IOC、模板模式實現的關鍵。
在C++中通過虛函數表的方式實現多態,每個包含虛函數的類都具有一個虛函數表(virtual table),在這個類對象的地址空間的最靠前的位置存有指向虛函數表的指針。在虛函數表中,按照聲明順序依次排列所有的虛函數。由于C++在運行時并不維護類型信息,所以在編譯時直接在子類的虛函數表中將被子類重寫的方法替換掉。
在Java中,在運行時會維持類型信息以及類的繼承體系。每一個類會在方法區中對應一個數據結構用于存放類的信息,可以通過Class對象訪問這個數據結構。其中,類型信息具有superclass屬性指示了其超類,以及這個類對應的方法表(其中只包含這個類定義的方法,不包括從超類繼承來的)。而每一個在堆上創建的對象,都具有一個指向方法區類型信息數據結構的指針,通過這個指針可以確定對象的類型。
上面這段是我從網上摘取過來的,說的有一定道理,但是也不全對。至于為啥,我會在后文介紹到Klass的時候細說。
關于opp-klass模型的整體定義,在HotSpot的源碼中可以找到。
oops模塊可以分成兩個相對獨立的部分:OOP框架和Klass框架。
在oopsHierarchy.hpp里定義了oop和klass各自的體系。
oop
oop體系:
- //定義了oops共同基類
- typedef class oopDesc* oop;
- //表示一個Java類型實例
- typedef class instanceOopDesc* instanceOop;
- //表示一個Java方法
- typedef class methodOopDesc* methodOop;
- //表示一個Java方法中的不變信息
- typedef class constMethodOopDesc* constMethodOop;
- //記錄性能信息的數據結構
- typedef class methodDataOopDesc* methodDataOop;
- //定義了數組OOPS的抽象基類
- typedef class arrayOopDesc* arrayOop;
- //表示持有一個OOPS數組
- typedef class objArrayOopDesc* objArrayOop;
- //表示容納基本類型的數組
- typedef class typeArrayOopDesc* typeArrayOop;
- //表示在Class文件中描述的常量池
- typedef class constantPoolOopDesc* constantPoolOop;
- //常量池告訴緩存
- typedef class constantPoolCacheOopDesc* constantPoolCacheOop;
- //描述一個與Java類對等的C++類
- typedef class klassOopDesc* klassOop;
- //表示對象頭
- typedef class markOopDesc* markOop;
上面列出的是整個Oops模塊的組成結構,其中包含多個子模塊。每一個子模塊對應一個類型,每一個類型的OOP都代表一個在JVM內部使用的特定對象的類型。
從上面的代碼中可以看到,有一個變量opp的類型是oppDesc ,OOPS類的共同基類型為oopDesc。
- class oopDesc {
- friend class VMStructs;
- private:
- volatile markOop _mark;
- union _metadata {
- wideKlassOop _klass;
- narrowOop _compressed_klass;
- } _metadata;
- }
在Java程序運行過程中,每創建一個新的對象,在JVM內部就會相應地創建一個對應類型的OOP對象。在HotSpot中,根據JVM內部使用的對象業務類型,具有多種oopDesc的子類。除了oppDesc類型外,opp體系中還有很多instanceOopDesc、arrayOopDesc 等類型的實例,他們都是oopDesc的子類。
這些OOPS在JVM內部有著不同的用途,例如,instanceOopDesc表示類實例,arrayOopDesc表示數組。也就是說,當我們使用new創建一個Java對象實例的時候,JVM會創建一個instanceOopDesc對象來表示這個Java對象。同理,當我們使用new創建一個Java數組實例的時候,JVM會創建一個arrayOopDesc對象來表示這個數組對象。
在HotSpot中,oopDesc類定義在oop.hpp中,instanceOopDesc定義在instanceOop.hpp中,arrayOopDesc定義在arrayOop.hpp中。
簡單看一下相關定義:
- class instanceOopDesc : public oopDesc {
- }
- class arrayOopDesc : public oopDesc {
- }
通過上面的源碼可以看到,instanceOopDesc實際上就是繼承了oopDesc,并沒有增加其他的數據結構,也就是說instanceOopDesc中包含兩部分數據:markOop _mark和union _metadata。
這里的markOop你可能又熟悉了,這不就是OOPS體系中的一部分嗎,上面注釋中已經說過,他表示對象頭。 _metadata是一個聯合體,這個字段被稱為元數據指針。指向描述類型Klass對象的指針。
HotSpot虛擬機中,對象在內存中存儲的布局可以分為三塊區域:對象頭、實例數據和對齊填充。在虛擬機內部,一個Java對象對應一個instanceOopDesc的對象,該對象中有兩個字段分別表示了對象頭和實例數據。那就是_mark和_metadata。
文章開頭我們就說過,之所以我們要寫這篇文章,是因為對象頭中有和鎖相關的運行時數據,這些運行時數據是synchronized以及其他類型的鎖實現的重要基礎。因為本文主要介紹的oop-klass模型,在這里暫時不對對象頭做展開,下一篇文章介紹。
前面介紹到的_metadata是一個共用體,其中_klass是普通指針,_compressed_klass是壓縮類指針。在深入介紹之前,就要來到oop-Klass中的另外一個主角klass了。
klass
klass體系
- //klassOop的一部分,用來描述語言層的類型
- class Klass;
- //在虛擬機層面描述一個Java類
- class instanceKlass;
- //專有instantKlass,表示java.lang.Class的Klass
- class instanceMirrorKlass;
- //專有instantKlass,表示java.lang.ref.Reference的子類的Klass
- class instanceRefKlass;
- //表示methodOop的Klass
- class methodKlass;
- //表示constMethodOop的Klass
- class constMethodKlass;
- //表示methodDataOop的Klass
- class methodDataKlass;
- //最為klass鏈的端點,klassKlass的Klass就是它自身
- class klassKlass;
- //表示instanceKlass的Klass
- class instanceKlassKlass;
- //表示arrayKlass的Klass
- class arrayKlassKlass;
- //表示objArrayKlass的Klass
- class objArrayKlassKlass;
- //表示typeArrayKlass的Klass
- class typeArrayKlassKlass;
- //表示array類型的抽象基類
- class arrayKlass;
- //表示objArrayOop的Klass
- class objArrayKlass;
- //表示typeArrayOop的Klass
- class typeArrayKlass;
- //表示constantPoolOop的Klass
- class constantPoolKlass;
- //表示constantPoolCacheOop的Klass
- class constantPoolCacheKlass;
和oopDesc是其他oop類型的父類一樣,Klass類是其他klass類型的父類。
Klass向JVM提供兩個功能:
- 實現語言層面的Java類(在Klass基類中已經實現)
- 實現Java對象的分發功能(由Klass的子類提供虛函數實現)
文章開頭的時候說過:之所以設計oop-klass模型,是因為HotSopt JVM的設計者不想讓每個對象中都含有一個虛函數表。
HotSopt JVM的設計者把對象一拆為二,分為klass和oop,其中oop的職能主要在于表示對象的實例數據,所以其中不含有任何虛函數。而klass為了實現虛函數多態,所以提供了虛函數表。所以,關于Java的多態,其實也有虛函數的影子在。
_metadata是一個共用體,其中_klass是普通指針,_compressed_klass是壓縮類指針。這兩個指針都指向instanceKlass對象,它用來描述對象的具體類型。
instanceKlass
JVM在運行時,需要一種用來標識Java內部類型的機制。在HotSpot中的解決方案是:為每一個已加載的Java類創建一個instanceKlass對象,用來在JVM層表示Java類。
來看下instanceKlass的內部結構:
- //類擁有的方法列表
- objArrayOop _methods;
- //描述方法順序
- typeArrayOop _method_ordering;
- //實現的接口
- objArrayOop _local_interfaces;
- //繼承的接口
- objArrayOop _transitive_interfaces;
- //域
- typeArrayOop _fields;
- //常量
- constantPoolOop _constants;
- //類加載器
- oop _class_loader;
- //protected域
- oop _protection_domain;
- ....
可以看到,一個類該具有的東西,這里面基本都包含了。
這里還有個點需要簡單介紹一下。
在JVM中,對象在內存中的基本存在形式就是oop。那么,對象所屬的類,在JVM中也是一種對象,因此它們實際上也會被組織成一種oop,即klassOop。同樣的,對于klassOop,也有對應的一個klass來描述,它就是klassKlass,也是klass的一個子類。klassKlass作為oop的klass鏈的端點。關于對象和數組的klass鏈大致如下圖:
在這種設計下,JVM對內存的分配和回收,都可以采用統一的方式來管理。oop-klass-klassKlass關系如圖:
內存存儲
關于一個Java對象,他的存儲是怎樣的,一般很多人會回答:對象存儲在堆上。稍微好一點的人會回答:對象存儲在堆上,對象的引用存儲在棧上。今天,再給你一個更加顯得牛逼的回答:
對象的實例(instantOopDesc)保存在堆上,對象的元數據(instantKlass)保存在方法區,對象的引用保存在棧上。
其實如果細追究的話,上面這句話有點故意賣弄的意思。因為我們都知道。方法區用于存儲虛擬機加載的類信息、常量、靜態變量、即時編譯器編譯后的代碼等數據。 所謂加載的類信息,其實不就是給每一個被加載的類都創建了一個 instantKlass對象么。
talk is cheap ,show me the code :
- class Model
- {
- public static int a = 1;
- public int b;
- public Model(int b) {
- this.b = b;
- }
- }
- public static void main(String[] args) {
- int c = 10;
- Model modelA = new Model(2);
- Model modelB = new Model(3);
- }
存儲結構如下:
總結
每一個Java類,在被JVM加載的時候,JVM會給這個類創建一個instanceKlass,保存在方法區,用來在JVM層表示該Java類。當我們在Java代碼中,使用new創建一個對象的時候,JVM會創建一個instanceOopDesc對象,這個對象中包含了兩部分信息,方法頭以及元數據。對象頭中有一些運行時數據,其中就包括和多線程相關的鎖的信息。元數據其實維護的是指針,指向的是對象所屬的類的instanceKlass。
【本文是51CTO專欄作者Hollis的原創文章,作者微信公眾號Hollis(ID:hollischuang)】