JVM 與 GC 講解,你學會了嗎?
一、概述
- JVM(Java Virtual Machine)是一種在計算機上運行Java字節碼的虛擬機。它允許Java程序在不同的操作系統上具有跨平臺的能力,因為它提供了一個統一的運行環境。JVM 負責將Java源代碼編譯成字節碼,然后在運行時解釋執行或者編譯執行這些字節碼。
- GC(Garbage Collection)是JVM的一個重要功能,用于自動管理內存。在Java中,開發人員不需要手動分配和釋放內存,因為 GC 負責監測內存中不再使用的對象,并將它們自動回收以釋放內存資源。這樣可以減少內存泄漏和程序崩潰的風險,但同時也會引入一些性能開銷。
GC 有不同的實現方式,其中兩種主要的策略是:
- 標記-清除(Mark and Sweep):這是最基本的垃圾回收算法。它首先標記所有仍然被引用的對象,然后清除那些沒有被標記的對象,從而釋放其占用的內存空間。這種方法可能導致內存碎片化問題,從而影響程序性能。
- 分代垃圾回收(Generational Garbage Collection):根據對象的生命周期將內存分為不同的代(Generation),一般分為年輕代(Young Generation)和老年代(Old Generation)。大多數對象在短時間內就會變成垃圾,所以年輕代采用較短周期的GC策略,而老年代則采用更長周期的策略。常見的分代垃圾回收算法是G1(Garbage-First)垃圾回收器。
JVM 的 GC 對應用程序性能有著重要影響。頻繁的 GC 事件可能導致應用程序的暫停時間增加,從而降低用戶體驗。為了優化 GC 性能,開發人員可以采取以下措施:
- 選擇合適的GC算法和回收器:根據應用程序的性質和需求,選擇適合的GC算法和回收器,如Serial GC、Parallel GC、Concurrent Mark-Sweep(CMS)GC、G1 GC等。
- 調整堆內存大小:適當設置堆內存大小,避免過大或過小的堆對性能產生負面影響。
- 避免創建過多臨時對象:過多的臨時對象會導致頻繁的GC事件。可以重用對象或者使用對象池來減少臨時對象的創建。
- 優化對象的生命周期:盡量使對象的生命周期與其實際使用時間相符,避免長時間存活的對象進入年輕代,從而減少老年代的壓力。
- 監控和調優:使用 JVM 性能分析工具來監控 GC 事件,找出性能瓶頸并進行調優。
總之,理解 JVM 和 GC 的工作原理對于編寫高性能、穩定的Java應用程序至關重要。
二、JVM 內存模型
圖片
Java虛擬機(JVM)內存模型定義了Java程序在運行時如何使用計算機的內存資源。它將內存劃分為不同的區域,每個區域用于存儲不同類型的數據和執行不同的任務。以下是JVM內存模型的主要部分:
- 方法區(Method Area):方法區是一個用于存儲類結構信息、常量、靜態變量、即時編譯器編譯后的代碼等的區域。它在JVM啟動時被創建,并且對于每個類加載器只存在一個方法區。在較早的JVM版本中,方法區被稱為“永久代”(Permanent Generation),但在Java 8及以后的版本中,永久代被移除,而是用元空間(Metaspace)取代。
- 堆(Heap):堆是Java程序運行時對象的主要存儲區域。它被用來存儲各種對象實例,包括用戶自定義對象以及運行時創建的對象。堆被劃分為新生代(Young Generation)和老年代(Old Generation)。新生代主要用于存放新創建的對象,老年代用于存放生命周期較長的對象。
- 新生代:新生代又被劃分為Eden空間和兩個Survivor空間(通常稱為S0和S1)。新創建的對象首先被分配到Eden空間,經過一些垃圾回收操作后,仍然存活的對象會被移動到Survivor空間,然后經過多次垃圾回收后,仍然存活的對象會被晉升到老年代。老年代:老年代主要用于存放經過多次垃圾回收仍然存活的對象,這些對象的生命周期較長。
- 棧(Stack):棧被用來存儲線程的局部變量、方法調用和返回信息。每個線程都有自己的棧空間,棧中的數據存儲在棧幀中,每個方法調用會創建一個新的棧幀。棧是一個后進先出(LIFO)的數據結構。
- 本地方法棧(Native Method Stack):本地方法棧與棧類似,但是它用于存儲Java方法調用本地方法(用其他語言編寫的方法)時的信息。
- 程序計數器(Program Counter):每個線程都有一個程序計數器,它保存著線程正在執行的JVM指令的地址。在線程切換時,程序計數器的值會更新到新線程的執行位置。
- 直接內存(Direct Memory):直接內存并不是JVM運行時數據區的一部分,但它與Java NIO(New I/O)相關。直接內存是通過ByteBuffer等NIO類分配的,實際上是在堆之外的內存,但是它由JVM管理。
JVM內存模型的理解對于編寫高效且穩定的Java應用程序至關重要。通過對不同內存區域的管理和優化,可以提高應用程序的性能和可靠性。
三、GC算法和回收器
在Java虛擬機(JVM)中,垃圾回收(GC)是自動管理內存的機制,而垃圾回收涉及兩個主要方面:垃圾回收算法和垃圾回收器。垃圾回收算法定義了如何判斷哪些對象是垃圾以及如何回收它們,而垃圾回收器是實際執行垃圾回收算法的組件。
以下是一些常見的垃圾回收算法和垃圾回收器:
1)垃圾回收算法
- 標記-清除(Mark and Sweep)算法:
- 首先,標記階段標記所有可達的對象。
- 然后,清除階段將未被標記的對象回收,釋放內存空間。
- 標記-整理(Mark and Compact)算法:
標記階段與標記-清除算法相同,標記所有可達對象。
整理階段將存活的對象移動到一側,然后釋放未被移動的內存。
復制(Copying)算法:
將內存分為兩個區域,通常是Eden和Survivor空間。
在每次垃圾回收時,將存活的對象從一個區域復制到另一個區域,然后清除原區域。
增量式和并發式算法:
增量式垃圾回收:將垃圾回收過程分成多個階段,在應用程序執行期間交替執行,減少停頓時間。
并發式垃圾回收:允許在應用程序執行時進行垃圾回收,從而減少停頓時間。
2)垃圾回收器
- Serial 回收器:
- 單線程垃圾回收器,主要用于新生代。
- 使用復制算法進行垃圾回收。
- Parallel 回收器:
多線程垃圾回收器,適用于多核處理器。
主要用于新生代,使用復制算法。
CMS(Concurrent Mark-Sweep)回收器:
并發垃圾回收器,用于老年代。
標記-清除算法,允許在應用程序執行時部分并發執行。
G1(Garbage-First)回收器:
面向大堆和低停頓時間的垃圾回收器。
使用標記-整理算法,將內存劃分為多個區域,優先回收包含垃圾最多的區域。
ZGC和Shenandoah:
最小化停頓時間的垃圾回收器,適用于大堆。
使用不同的算法和技術來實現低停頓時間的垃圾回收。
每種垃圾回收算法和垃圾回收器都有其適用的場景和性能特點。選擇適當的垃圾回收器取決于應用程序的需求,內存使用情況和性能目標。
四、垃圾回收機制(GC)
圖片
Java垃圾回收機制是一種自動管理內存的機制,由Java虛擬機(JVM)負責。它的目標是通過檢測和回收不再被程序引用的對象,釋放內存并防止內存泄漏。以下是Java垃圾回收機制的主要特點:
- 可達性分析:Java的垃圾回收機制基于可達性分析。JVM會從一組根對象(如全局變量、靜態變量、活躍線程的局部變量等)開始,逐步遍歷對象之間的引用關系,找到所有可達的對象。那些不可達的對象被認為是垃圾,可以被垃圾回收器回收。
- 分代垃圾回收:Java的垃圾回收采用了分代回收策略。內存被分為新生代(Young Generation)和老年代(Old Generation)。新創建的對象通常會分配在新生代,而生命周期較長的對象則晉升到老年代。不同代使用不同的垃圾回收算法。
- 新生代垃圾回收:新生代內存被劃分為Eden空間和兩個Survivor空間(通常稱為S0和S1)。通常使用復制算法,在新生代之間來回復制存活的對象。經過多次回收后仍然存活的對象會被晉升到老年代。
- 老年代垃圾回收:老年代內存通常存放著生命周期較長的對象。老年代的回收算法包括標記-整理(Mark and Compact)和標記-清除(Mark and Sweep)。
- 并發和并行垃圾回收:一些JVM實現支持并發(Concurrent)垃圾回收和并行(Parallel)垃圾回收。并發垃圾回收允許在應用程序執行時進行部分垃圾回收,以減少停頓時間。并行垃圾回收使用多個線程并行執行垃圾回收操作,以提高回收效率。
- G1垃圾回收器:Java 7引入了G1(Garbage-First)垃圾回收器,它是一種面向大堆、高吞吐量和低停頓時間的垃圾回收器。G1將內存劃分為不同的區域,并優先回收包含垃圾最多的區域,從而最大限度地減少停頓時間。
- 元空間:在Java 8及以后的版本中,永久代被移除,而是用元空間(Metaspace)來管理類的元數據和靜態變量。元空間不再受到固定大小的限制,可以根據應用程序的需求動態調整。
1)分代垃圾回收機制
分代垃圾回收機制是一種內存管理策略,主要用于優化垃圾回收的效率。它的核心思想是將內存劃分為不同的代(Generation),通常包括新生代(Young Generation)和老年代(Old Generation),以便更有效地管理不同生命周期的對象。
圖片
以下是分代垃圾回收機制的原理:
- 新生代(Young Generation):
新生代主要用于分配新創建的對象。由于大部分對象的生命周期很短,新生代采用了一種高效的垃圾回收算法,通常是復制算法(Copying Algorithm)。
新生代被分為三個部分:Eden空間和兩個Survivor空間(通常稱為S0和S1)。新創建的對象首先分配在Eden空間。
在垃圾回收過程中,首先會將Eden空間和一個Survivor空間中仍然存活的對象復制到另一個Survivor空間中,然后清除Eden和前一個Survivor空間中的所有對象。這樣,每次垃圾回收后,存活的對象仍然保留在新生代。
- 晉升與老年代(Promotion and Old Generation):
在經過多次新生代的垃圾回收后,仍然存活的對象會被晉升到老年代。晉升的條件通常包括對象的年齡(在Survivor空間中的次數)和老年代的空間大小等。
老年代主要用于存放生命周期較長的對象,因此老年代的垃圾回收策略通常使用標記-整理(Mark and Compact)或標記-清除(Mark and Sweep)算法。
分代切換:
分代垃圾回收通過合理地將對象在不同代之間進行切換,將不同生命周期的對象分配到適當的內存區域。
新對象首先分配在新生代,然后通過多次垃圾回收判斷其是否仍然存活。如果存活,它會被晉升到老年代,而不再頻繁地在新生代進行垃圾回收。
分代垃圾回收機制的原理是根據對象的生命周期特點,將不同生命周期的對象放置在不同的內存區域,并使用不同的垃圾回收策略,從而提高了垃圾回收的效率和性能。這種機制在處理短壽命對象和長壽命對象的應用中具有優勢。
2)G1 垃圾回收器
G1(Garbage-First)收集器是Java虛擬機(JVM)中的一種垃圾回收器,旨在提供更高吞吐量和更穩定的停頓時間。它于JDK 7引入,主要針對大內存堆和低停頓時間的應用場景。G1收集器通過將堆內存劃分為多個區域(Region)來管理內存,并采用不同的垃圾回收策略來實現其目標。
以下是G1收集器的一些特點和工作原理:
- 區域劃分:G1 將堆內存劃分為多個大小相等的區域,每個區域通常是1MB到32MB的大小。這些區域可以是 Eden 區、Survivor 區或老年區。
- Mixed GC:G1 收集器使用 Mixed GC 策略,它綜合了新生代和老年代的垃圾回收策略。在每次垃圾回收時,G1 會根據當前垃圾回收的需求來選擇要回收的區域,優先選擇包含垃圾最多的區域進行回收。
- 并發標記:G1 采用并發標記算法,允許在應用程序執行時進行標記階段。這有助于減少垃圾回收造成的停頓時間。標記階段將標記所有存活的對象,以便在后續的垃圾回收階段進行回收。
- 整理階段:G1 使用標記-整理(Mark and Compact)算法來進行垃圾回收,以減少碎片。在回收過程中,G1 會將存活對象移動到堆的一側,然后清除未被移動的區域。
- Region之間的引用:G1 會跟蹤Region 之間的引用關系,以幫助確定存活對象的引用鏈。這有助于在回收時快速找到存活的對象。
- 停頓時間目標:G1 的一個主要目標是控制垃圾回收造成的停頓時間。它會根據用戶設置的停頓時間目標來調整垃圾回收的頻率和區域的選擇,以盡量減少長時間的停頓。
G1 收集器在大堆內存和低停頓時間的應用場景下表現出色。它通過區域劃分、并發標記和 Mixed GC等策略,減少了垃圾回收帶來的長時間停頓,同時提供了相對較高的吞吐量。根據應用程序的需求和性能目標,選擇適當的垃圾回收器非常重要,G1 是一個在這方面具有競爭力的選擇。
3)FullGC 機制
Full GC(Full Garbage Collection) 是指對整個堆內存(包括新生代和老年代)進行垃圾回收的操作,它的執行會導致應用程序的停頓時間較長。相對而言,Full GC 的停頓時間通常比部分垃圾回收(如新生代的垃圾回收)要長,因為它需要處理整個堆內存中的對象。
圖片
Full GC 通常會在以下情況下發生:
- 內存不足:當堆內存中的對象數量增加,達到了堆內存的容量上限,就會觸發Full GC,以嘗試釋放更多的內存空間。
- 長時間運行后:長時間運行的Java應用程序可能會導致老年代中的對象堆積,最終觸發Full GC,以清理老年代中的垃圾對象。
- 顯式調用:開發人員可以通過Java代碼中的System.gc()方法顯式調用垃圾回收,其中可能會包括Full GC操作。
Full GC執行的過程通常包括以下步驟:
圖片
- 標記階段:標記所有存活的對象,包括新生代和老年代中的對象。
- 整理階段:對老年代中的存活對象進行整理,以減少內存碎片。
- 回收階段:回收所有未被標記的對象,釋放內存空間。
Full GC 的停頓時間較長,可能會對應用程序的性能和響應時間產生影響。因此,在設計和優化Java應用程序時,需要根據應用的需求和性能目標,合理配置堆內存大小、垃圾回收策略以及選擇合適的垃圾回收器,以盡量減少Full GC的發生和影響。