干貨分享丨jvm系列:dump文件深度分析
JVM dump
java內(nèi)存dump是jvm運(yùn)行時(shí)內(nèi)存的一份快照,利用它可以分析是否存在內(nèi)存浪費(fèi),可以檢查內(nèi)存管理是否合理,當(dāng)發(fā)生OOM的時(shí)候,可以找出問題的原因。那么dump文件的內(nèi)容是什么樣的呢?我們一步一步來
獲取JVM dump文件
獲取dump文件的方式分為主動和被動
i.主動方式:
1.利用jmap,也是最常用的方式:jmap -dump:[live],format=b,file=
2.利用jcmd,jcmd GC.heap_dump
3.使用VisualVM,可以界面操作進(jìn)行dump內(nèi)存
4.通過JMX的方式
- MBeanServer server = ManagementFactory.getPlatformMBeanServer();
- HotSpotDiagnosticMXBean mxBean = ManagementFactory.newPlatformMXBeanProxy(server, "com.sun.management:type=HotSpotDiagnostic", HotSpotDiagnosticMXBean.class);
- mxBean.dumpHeap(filePath, live);
參考(https://www.baeldung.com/java...
ii.被動方式:
被動方式就是我們通常的OOM事件了,通過設(shè)置參數(shù)-XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=
dump文件分析
結(jié)構(gòu)示意圖
結(jié)構(gòu)詳解
dump文件是堆內(nèi)存的映射,由文件頭和一系列內(nèi)容塊組成
文件頭
由musk, 版本,identifierSize, 時(shí)間4部分組成
1、musk:4個(gè)byte,內(nèi)容為'J', 'A', 'V', 'A'即JAVA
2、version:若干byte,值有以下三種
- " PROFILE 1.0\0",
- " PROFILE 1.0.1\0",
- " PROFILE 1.0.2\0"
3、identifierSize:4個(gè)byte數(shù)字,值為4或者8,表示一個(gè)引用所占用的byte數(shù)
4、time:8個(gè)byte,dump文件生成時(shí)間
說明:java一個(gè)類的成員變量有兩種類型
- 基本類型(8種基本類型),它們占用byte數(shù)固定不變,每生成一個(gè)對象它們就需要給它們賦初始值,分配空間
- 是引用類型,表示一個(gè)對象,在類中只有一個(gè)引用,引用只是一個(gè)數(shù)值,所占用的空間大小為identifierSize,被引用對象即將在堆中的另一個(gè)地方
例如定義一個(gè)類
- public class Person {
- private int age;//4個(gè)byte
- private String name;//identifierSize個(gè)byte
- private double weight;//8個(gè)byte
- }
當(dāng)我們在new Person()的時(shí)候
它就需要申請一個(gè)空間,空間大小為 對象頭大小+4+identifierSize+8個(gè)byte
對象大小的測量:
jdk提供一個(gè)測試對象占用內(nèi)存大小的工具Instrumentation,但是Instrumentation沒法直接引用到,需要通過agent來引用到
定義一個(gè)Premain類, javac Premain.java
- //Premain.java
- public class Premain {
- public static java.lang.instrument.Instrumentation inst;
- public static void premain(String args, java.lang.instrument.Instrumentation inst) {
- Premain.inst = inst;
- }
- }
編寫一個(gè)Manifest文件
- manifest.mf
- Manifest-Version: 1.0
- Premain-Class: Premain
- Can-Redefine-Classes: true
- Can-Retransform-Classes: true
打包
- jar -cmf manifest.mf premain.jar Premain.class
定義一個(gè)執(zhí)行類, javac PersonTest.java
- //PersonTest.java
- public class PersonTest {
- public static void main(String[] args) throws Exception {
- Class clazz = Class.forName("Premain");
- if (clazz != null) {
- Person p = new Person();
- java.lang.instrument.Instrumentation inst = (java.lang.instrument.Instrumentation)clazz.getDeclaredField("inst").get(null);
- System.out.println("person size:[" + inst.getObjectSize(p) + "]B");
- System.out.println("class size:[" + inst.getObjectSize(p.getClass()) + "]B");
- }
- }
- }
帶agent執(zhí)行
- java -javaagent:premain.jar PersonTest
結(jié)果:
- person size:[32]B
- class size:[504]B
內(nèi)容塊
每個(gè)塊都是塊頭和塊體組成
塊頭
塊頭由1個(gè)byte的塊類型,4個(gè)byte的時(shí)間time,4個(gè)byte的長度表示此內(nèi)容塊占用byte數(shù)
type類型一般有5種,字符串,類,棧楨,棧,及dump塊
- 字符串,由identifierSize個(gè)byte的字符串id,后面是(length-identifierSize)個(gè)byte的字符串內(nèi)容(后續(xù)對字符串是直接引用的這里面的id)
- 類,由4個(gè)byte的類序列(在棧楨中使用),identifierSize個(gè)byte的類id(解析類的時(shí)候用到),4個(gè)byte的序列id(暫未使用),identifierSize個(gè)byte的類名id
- 棧楨,由identifierSize個(gè)byte的楨id,identifierSize個(gè)byte的方法名id,identifierSize個(gè)byte的方法標(biāo)識id,identifierSize個(gè)byte的類文件名id,4個(gè)byte的類序列,4個(gè)byte的行號
- 棧,由4個(gè)byte的棧序號,4個(gè)byte的線程序號,4個(gè)byte的楨數(shù)量,后面就是若干個(gè)identifierSize個(gè)byte的楨id
- dump塊就是所有對象的內(nèi)容了,每個(gè)對象由1個(gè)byte的子類型,和對象內(nèi)容結(jié)成,子類型有6種,gc root, 線程對象,類,對象,基本類型數(shù)組,對象數(shù)組
gc root
gc root有4種結(jié)構(gòu),8種類型
- identifierSize個(gè)byte的對象id,類型有SYSTEM_CLASS,BUSY_MONITOR, 及未UNKNOWN
- identifierSize個(gè)byte的對象id,4個(gè)byte的線程序列號,類型有NATIVE_STACK,THREAD_BLOCK
- identifierSize個(gè)byte的對象id,4個(gè)byte的線程序列號,4個(gè)byte的棧楨深度,類型有JAVA_LOCAL,NATIVE_LOCAL
- identifierSize個(gè)byte的對象id,identifierSize個(gè)byte的global refId(暫未使用),類型有NATIVE_STATIC
gc root示意圖
gc root為垃圾收集追溯的源頭,每個(gè)gc root都指向一個(gè)初始對象,無法追溯的對象是要被回收掉的
系統(tǒng)類,只有classLoader為null的類才是gc root,每個(gè)類都是一個(gè)gc root
線程棧,線程中方法參數(shù),局部變量都是gc root,每個(gè)對象都是一個(gè)gc root
系統(tǒng)保留對象,每個(gè)對象都是一個(gè)gc root
類對象
1、基本信息:
- identifierSize個(gè)byte的類對象id
- 4個(gè)byte的棧序列號,
- identifierSize個(gè)byte的父類對象id,
- identifierSize個(gè)byte的classLoader對象id,
- identifierSize個(gè)byte的Signer對象id,
- identifierSize個(gè)byte的protection domain對象id,
- identifierSize個(gè)byte的保留id1和id2,
- 4個(gè)byte的類實(shí)例對象大小,
- 2個(gè)byte的常量個(gè)數(shù),后面是每個(gè)常量的,2個(gè)byte的下標(biāo),1個(gè)byte的常量類型,和若干個(gè)byte的內(nèi)容,內(nèi)容根據(jù)類型來決定(boolean/byte為1個(gè)byte, char/short為2個(gè)byte,float/int為4個(gè)byte, double/long為8個(gè)byte,引用類型為identifierSize個(gè)byte)
10. 2個(gè)byte的靜態(tài)變量個(gè)數(shù),后面是每個(gè)靜態(tài)變量的,identifierSize個(gè)byte的變量名id, 1個(gè)byte的變量類型,和若干個(gè)byte的內(nèi)容,內(nèi)容根據(jù)類型來決定(見類對象基本信息的第9條)
11. 2個(gè)byte的成員變量個(gè)數(shù),后面是每個(gè)成員變量的,identifierSize個(gè)byte的變量名id,1個(gè)byte的變量類型
2、說明:
(1)類里面的常量很多地方都沒有用上,所以常量個(gè)數(shù)一般為0
(2)類的靜態(tài)變量的名稱類型及值是放在類對象里面的,成員變量的名稱和類型也是放在類對象里面的,但是實(shí)例的值是放在實(shí)例對象里面的
實(shí)例對象
1、基本信息:
- identifierSize個(gè)byte的實(shí)例對象id
- 4個(gè)byte的棧序列號
- identifierSize個(gè)byte的類id
- 4個(gè)byte的占用字節(jié)數(shù)
- 實(shí)例的變量的值
2、說明:
- 實(shí)例的值為實(shí)例對象的成員變量值,順序?yàn)楫?dāng)前類的變量值,順序?yàn)轭悓ο蠡拘畔⒅械?1條中的順序,然后是父類的變量值
- 變量的值基本類型都有默認(rèn)值,引用類型默認(rèn)值為0,占用字節(jié)數(shù)(見類對象基本信息的第9條)
基本類型數(shù)組
1、基本信息:
- identifierSize個(gè)byte的數(shù)組對象id
- 4個(gè)byte的棧序列號
- 4個(gè)byte的數(shù)組長度
- 1個(gè)byte的元素類型
- 元素的值列表
2、說明:
- 元素的值(見類對象基本信息的第9條)
對象數(shù)組
1、基本信息:
- identifierSize個(gè)byte的數(shù)組對象id
- 4個(gè)byte的棧序列號
- 4個(gè)byte的數(shù)組長度
- identifierSize個(gè)byte的元素類id
- 元素的值列表
內(nèi)存分配
當(dāng)一個(gè)線程啟動的時(shí)候,進(jìn)程會去系統(tǒng)內(nèi)存生成一個(gè)線程棧
每當(dāng)發(fā)生一次方法調(diào)用,就會向棧中壓入一個(gè)棧楨,當(dāng)方法調(diào)用完之后,棧楨會退出
在運(yùn)行過程中,如果有對象的new操作的時(shí)候,進(jìn)程會去堆區(qū)申請一塊內(nèi)存
關(guān)于運(yùn)行時(shí)內(nèi)存的詳細(xì)情況,可以查找相關(guān)的資料
內(nèi)存回收規(guī)則
如果一個(gè)對象不能騎過gc root引用可達(dá),那么這個(gè)對象就可能要被回收
對象回收規(guī)則包括
- 實(shí)例屬性被實(shí)例引用,只有當(dāng)實(shí)例被回收了實(shí)例屬性才能被回收(只針對強(qiáng)引用)
- 類對象被實(shí)例引用,只有當(dāng)一個(gè)類的所有實(shí)例都被回收了,類才能被回收
- 類對象的父類,classLoader對象,signer對象, protection domain對象被類引用,只有當(dāng)類被回收了,這些才能被回收
- 局部變量(線程棧中)的作用域?yàn)橐粋€(gè)大括號
- public void test(){
- Object a = new Object();//obj 1
- Object b = new Object();//obj 2
- {
- Object c = new Object();//obj 3
- a = null;//obj 1可以被回收了
- }//obj 3可以回收了
- }//obj 2可以被回收了
分析工具簡介
分析dump文件,我們可以用jdk里面提供的jhat工具,執(zhí)行
- jhat xxx.dump
jhat加載解析xxx.dump文件,并開啟一個(gè)簡易的web服務(wù),默認(rèn)端口為7000,可以通過瀏覽器查看內(nèi)存中的一些統(tǒng)計(jì)信息
一般使用方法
1、瀏覽器打開http:/127.0.0.1:7000
會列出一些功能,包括package下面各個(gè)類的概覽,及各個(gè)功能導(dǎo)航
2、點(diǎn)擊頁面的堆內(nèi)存統(tǒng)計(jì)
有一個(gè)表格,對象類型,實(shí)例個(gè)數(shù),實(shí)例所占用內(nèi)存大小,哪種類型的對象占用了內(nèi)存最多一目了然
3、點(diǎn)擊其中認(rèn)為內(nèi)存消耗太多的類名查看類詳情
主要展現(xiàn)該類下面各個(gè)實(shí)例的大小,以及一些鏈接導(dǎo)航
4、點(diǎn)擊references summary by type
如果某種類型的對象太多,那么有可能是引用它的那個(gè)類的對象太多
基本上一些簡單頁面的查詢,結(jié)合原代碼,就可以初步定位內(nèi)存泄漏的地方
綜上,dump文件結(jié)構(gòu)還是比較簡單的,這對于分析線程的執(zhí)行情況非常有用,也是每一個(gè)Java程序員必須掌握的高級技能之一,你學(xué)會了嗎?