Java 的多態在 JVM 里原來是這樣的
多態
面向對象的編程語言里,「多態」是一個至關重要的概念。我們常說,面向對象的本質,是方法與數據的綁定。那對于一個擁有繼承關系的類之間,方法的綁定,是終是子類「重寫」父類的方法,通過父類的引用指向子類的對象,實現運行時的多態。
說起來比較繞,我們先以僅次于Hello World 著名的 「動物 - 狗」代碼來說明多態,然后再來分析在 JVM 層面,多態是怎樣實現的。
- package com.example.demo;
- public class Demo {
- public static void main(String[] args) {
- Animal a = new Animal();
- a.say();
- Dog d = new Dog();
- d.say();
- Animal ad = new Dog();
- ad.say();
- }
- }
- class Animal {
- public void say() {
- System.out.println("Animal say");
- }
- public void play() {
- System.out.println("play...");
- }
- }
- class Dog extends Animal {
- public void say() {
- System.out.println("Dog say");
- }
- }
輸出的內容對于習慣了面向對象的 Java 開發者來說都比較熟悉
- Animal say
- Dog say
- Dog say
那虛擬機是怎樣知道到底要調用 Animal 的 say 還是 Dog 的say呢?
咱們從字節碼的層面來看一下。
- 0 new #2 <com/example/demo/Animal>
- 3 dup
- 4 invokespecial #3 <com/example/demo/Animal.<init>>
- 7 astore_1
- 8 aload_1
- 9 invokevirtual #4 <com/example/demo/Animal.say>
- 12 new #5 <com/example/demo/Dog>
- 15 dup
- 16 invokespecial #6 <com/example/demo/Dog.<init>>
- 19 astore_2
- 20 aload_2
- 21 invokevirtual #7 <com/example/demo/Dog.say>
- 24 new #5 <com/example/demo/Dog>
- 27 dup
- 28 invokespecial #6 <com/example/demo/Dog.<init>>
- 31 astore_3
- 32 aload_3
- 33 invokevirtual #4 <com/example/demo/Animal.say>
- 36 return
你發現沒有,在字節碼的第9行,和第33行,分別對應到 d.say() 和 ad.say() ,但指令內容其實是一樣的。這就神奇了。
在這兩個方法執行前,第8行和第32行,會有一個aload的操作,是把這兩個對象的引用 壓到棧頂,給后面的操作用。這兩個對象,一般也被稱為方法的接收者(Receiver),如果熟悉 Golang等語言的朋友,對這個概念也不陌生。
從9行和第33行看,無論是方法調用的字節碼指令還是參數,都指向了常量池的第4項。都是一樣的,但最終結果并不相同。這里的重點在于 invokevirtual 這個指令的多態指行查找過程,即根據對象的 vtable 在運行時定位方法。
啥是 vtable?
前面的內容提到指令執行時從棧頂獲取當前方法的「接收者」,通過invokerirtual 來執行這個接者者對應的方法。 注意這里的 virtual,和C++的虛方法類似。這個咱們不提,只說Java 的。
對象都有一個自己的「方法表」,這個表里除了自己的方法,還有從父類繼承來的方法,甚至重寫的父類的方法。所以,對應于重寫與重載,體現在方法表里也有所區別。每個子類繼承父類的時候,都將直接復制一份父類的方法表,而對于父類方法的重寫,會直接更新方法表里相同順序的這個方法。
而重載,本質上由于簽名及參數的區別,是一個新的方法,在方法表里會是新增一個元素。
這里的這個方法表,就是咱們說的 vtable(Virtual Method Table),表里的每個方法,對應的是它的實際執行入口地址。如果沒有重寫,那父類和子類的地址是一樣的,都指向父類的實現。
如果子類重寫之后,子類方法表里的這個方法的地址就指向了自己實現的版本。
而我們上面字節碼處觀察到的,兩個 invokevirtual 對應的常量池索引序號是一樣的,這樣實現對于變換實現類型時,查找方法表只需要換個對象,索引依舊相同。
觀察
為了便于 Attach 到 Java 進程,可以在代碼里加下 latch 進行 awiat 阻塞,啟動 SA 就能觀察了。
選擇 ClassBrowser
在 Class列表里就能找到咱們上面創建的對象。@ 符號后面是這個對象對應的內存地址。復制上Dog的地址,再從菜單里選擇Inspector,
你看 _vtable_len: 7
這是告訴我們 vtable 長度是7,里面有7個方法。
實際上咱們在這個類里只重寫了父類 Animal 的 say方法,其它的是從 Animal 繼承來的 play方法,以及超類 Object 里的 5個方法,大概這個樣子
JVM 在首次加載類的時候,會解析類內包含的方法,方法解析之后就會計算當前類 vtable的大小。
可能你會問,Object 類內不止5個方法,為什么只算5個呢?而且我們新增其它static、 final 這一類的方法呢?
這里 vtable 只計算非static final 的,全部計算完就得出了vtable_len這個值。
每個 Java 的 Class 在 JVM 內部都會有一個自己的instanceKlass, vtable就分配在這個的最后。
整個instanceKlass的大小,在64位系統里大小是 0x1b8,記住它,后面用的著。 所以咱們上面看到了Dog 類的內存地址,繼續找就能看到他其它方法對應的內存地址。
在Windows -> console 里執行這個:
- mem 0x7C0060DD0 7
這個值怎么來的呢?是從對象的內存地址開始,加上 instanceKlass的大小。
- 0x7C0060DD0 = 0x00000007c0060c18 + 0x1b8
由于我們有7個方法,所以順序查找7個地址。
所以你應該也發現了,Java 里對應這種重寫的方法,是在類加載的時候,才能知道具體對應的是哪個方法,因此也被稱為動態綁定或者遲綁定。
總結起來,這里的 vtable,相當于你的工具清單,有什么能力都做了羅列,像鋼鐵俠的各項技能,每個功能指向具體的超能力,在我們代碼里可以把它理解成一個數組,數組的每個元素指向一個方法地址。
感興趣的話,你加個static 的方法自己找找,看看在不在這里面呢?畢竟static方法執行不是有 invokestatic 指令嘛。
本文轉載自微信公眾號「 Tomcat那些事兒」,可以通過以下二維碼關注。轉載本文請聯系 Tomcat那些事兒公眾號。