高并發系統必看！G1如何讓億級JVM吞吐量提升300%？

作者：碼哥字節 2025-03-04 08:52:21

開發前端

G1（Garbage-First）垃圾回收器應運而生，它以“可控的停頓時間”為核心設計目標，通過分區（Region）模型和智能回收策略，實現了低延遲與高吞吐的平衡。

在 Java 應用的運行中，垃圾回收（GC）是保障內存安全的核心機制，但傳統 GC 如 CMS 和 Parallel GC 常面臨兩大痛點：不可控的停頓時間和內存碎片問題。

例如，CMS 的“并發模式失敗”可能導致長達數秒的 Full GC 停頓，而大內存場景下頻繁的 Young GC 和 Mixed GC 可能拖累吞吐量。

本文將從設計思想、核心機制到實戰調優，帶你深入理解 G1 如何解決傳統 GC 的難題。

G1 分區模型

Region 分區模型

G1 將堆內存劃分為多個等大小的 Region（默認 1MB-32MB），每個 Region 可以是 Eden、Survivor 或 Old 區，默認是將堆內存按照 2048 份均分。

這種靈活的分區方式打破了傳統代際的物理隔離，允許動態調整各代內存占比。

Region 的角色（年輕代、老年代或大對象區）是動態分配的。例如，一個 Region 可能初始作為 Eden 區，回收后被標記為 Survivor 區，后續可能轉為老年代區。

大對象（Humongous 對象）：若對象大小超過 Region 的 50%，則分配到連續的 Humongous Region。此類對象回收需特殊處理，若空間不足可能觸發 Full GC。

例如，當老年代占用過高時，G1 會優先回收垃圾最多的 Region，而非全堆掃描。

跨代引用的智能追蹤

卡表（Card Table）：記錄跨 Region 的引用關系。例如，老年代對象引用年輕代對象時，對應的卡表條目會被標記為“臟卡”。

記憶集（RSet）：每個 Region 維護一個 RSet，存儲其他 Region 對其內部對象的引用。通過 RSet 快速定位跨 Region 引用，避免全堆掃描。

寫屏障（Write Barrier）：在對象引用修改時觸發，更新卡表和 RSet。例如，當老年代對象引用新生代對象時，寫屏障會記錄該引用。

混合回收（Mixed GC）

混合回收是 G1 的精髓：在一次回收中，同時處理年輕代和老年代的 Region。

通過計算回收收益（垃圾量/耗時），G1 選擇性價比最高的 Region 集合（Collection Set），在用戶設定的最大停頓時間內（如 200ms）完成回收。

在邏輯上，G1 分為年輕代和老年代，但它的年輕代和老年代比例，并不是那么“固定”，為了達到 MaxGCPauseMillis 所規定的效果，G1 會自動調整兩者之間的比例。

如果你強行使用 -Xmn 或者 -XX:NewRatio 去設定它們的比例的話，我們給 G1 設定的這個目標將會失效。

G1 的回收過程主要分為 3 類：

G1“年輕代”的垃圾回收，同樣叫 Minor GC，這個過程和我們前面描述的類似，發生時機就是 Eden 區滿的時候。
老年代的垃圾收集，嚴格上來說其實不算是收集，它是一個“并發標記”的過程，順便清理了一點點對象。
真正的清理，發生在“混合模式”，它不止清理年輕代，還會將老年代的一部分區域進行清理。

年輕代回收（Young GC）

Chaya：年輕代回收觸發流程是什么？

Eden 區占滿時觸發，僅回收年輕代 Region。回收流程如下所示：

根掃描：標記 GC Roots 直接可達的對象（如棧幀局部變量、靜態變量）。
RSet 處理：通過臟卡隊列更新 RSet，將老年代對年輕代的引用加入 GC Roots。
復制存活對象：將 Eden 和 Survivor 區的存活對象復制到新 Survivor 區，年齡達閾值（默認 15）則晉升老年代。
這個過程通常是 Stop-The-World（STW）的，即在回收過程中，應用程序的其他線程會被暫停。

混合回收（Mixed GC）

Chaya：混合回收的觸發條件是什么？

多次回收之后，會出現很多 Old 老年代區，此時總堆占有率達到閾值（默認 45%）時會觸發混合回收 MixedGC。混合回收會回收整個年輕代 + 部分老年代。

回收過程如下：

初始標記（STW）：標記 GC Roots 直接可達對象，耗時短。
并發標記：與應用線程并行，遍歷堆標記存活對象，使用三色標記法（黑、灰、白）避免漏標。
重新（最終）標記（STW）：處理并發標記期間引用變化（通過 SATB 算法保證一致性），修正標記結果。
篩選回收：根據 Region 的回收價值（垃圾占比與回收時間）選擇 Region 集合（Collection Set），復制存活對象并清理。

注意：當混合回收無法快速釋放足夠空間時觸發 Full GC（如大對象分配失敗），采用單線程標記-整理算法，導致長停頓。

初始標記

初始標記會暫停所有用戶線程，只標記從 GC Root 可直達的對象，所以停頓時間不會太長。

采用三色標記法進行標記，三色標記法在原有雙色標記（黑也就是 1 代表存活，白 0 代表可回收）增加了一種灰色。

三色標記法

黑色：對象及其引用均完成標記。
灰色：對象已標記，但引用未完全處理。
白色：未標記或待回收對象。
漏標問題解決：通過 SATB（Snapshot-At-The-Beginning）機制，記錄并發標記開始時的對象快照，確保標記一致性

并發標記

默認線程數為ParallelGCThreads的 1/4（通過-XX:ConcGCThreads調整），減少應用線程阻塞。

允許系統程序的運行，同時進行"GC Roots"追蹤，追蹤所有存活對象(間接引用的對象)。該階段很耗時，因為要追蹤全部的存活對象。但是是并發運行，對系統影響不大。

GC 開始前所有對象都是白色，GC 一開始所有根能夠直達的對象被壓到棧中，待搜索，此時顏色是灰色。

然后灰色對象依次從棧中取出搜索子對象，子對象也會被涂為灰色，入棧。

當其所有的子對象都涂為灰色之后該對象被涂為黑色。

當 GC 結束之后灰色對象將全部沒了，剩下黑色的為存活對象，白色的為垃圾。

需要注意的是：由于用戶線程可能同時在修改對象的引用關系，就會出現錯標的情況。

Chaya:那咋辦呢？

G1 為了解決這個問題，使用了SATB 技術（Snapshot At The Beginning，初始快照）。

在并發標記開始時，G1 會創建一個堆內存的快照，記錄所有存活對象的初始狀態。

在最終標記階段，系統會處理并發期間新增的引用變化，通過寫前屏障（Write Barrier）記錄這些變化，確保新對象不被錯誤回收。

最終標記

觸發時機：在并發標記（Concurrent Marking）完成后，G1 需要暫停所有應用線程（STW），以處理并發標記期間遺漏的引用變化，確保標記結果的準確性。

核心目標：修正并發標記階段因應用線程并發執行導致的對象引用變化（如新對象創建或引用更新），并生成最終的存活對象快照。

處理漏標對象：通過遍歷卡表（Card Table）中的“臟頁”（記錄引用修改的區域），重新掃描這些區域的對象，修正標記狀態

篩選回收

最終標記完成后，G1 根據停頓時間目標（MaxGCPauseMillis）和Region 回收價值，選擇最合適的區域進行回收。

優先回收垃圾比例高（存活對象少）的 Region，以最小化回收時間并最大化內存釋放效率。

根據每個 Region 的存活對象數量和回收時間成本計算“回收價值”，優先選擇存活率低、回收效率高的 Region 組成回收集（Collection Set, CSet）。

標記-復制算法：將存活對象從回收集的 Region 復制到空閑 Region，同時整理內存以減少碎片。

主要步驟如下所示：

構建回收集（CSet）：

根據 Region 的存活對象比例和用戶設定的停頓時間目標（如-XX:MaxGCPauseMillis），動態選擇需要回收的 Region。
通常包括所有年輕代 Region（Eden/Survivor）和部分老年代 Region（混合收集模式）

并行遷移存活對象：

暫停應用線程（STW），啟動多個 GC 線程并行執行。
將回收集內的存活對象復制到空閑 Region（如 Survivor 區或 Old 區的新 Region），并更新對象引用指針。

清理與釋放內存:

清空原 Region 的所有內容，將其標記為“空閑區域”。
更新Remembered Set（RSet）和卡表，記錄跨 Region 引用的變化。

調優策略與參數

案例一：年輕代配置

案例：某線上服務因誤設-Xmn256m覆蓋 G1 的自動調節，導致 Eden 區過小（僅 256MB），頻繁觸發 Young GC（600+次/壓測），響應時間激增。

解決方案：刪除-Xmn參數，由 G1 根據G1NewSizePercent（默認 5%）和G1MaxNewSizePercent（默認 60%）動態調整新生代大小，GC 時間從 25 秒降至 1 秒內。

案例二：老年代“擁堵治理”

動態年齡判定：若 Survivor 區使用超過 50%（TargetSurvivorRatio默認值），對象會直接晉升老年代。需通過增大 Survivor 區或降低晉升閾值（MaxTenuringThreshold），避免過早“占道”。

混合回收觸發閾值：默認InitiatingHeapOccupancyPercent=45%（老年代占比），高并發場景可適度調低以提前回收，避免 Full GC。

大對象“專車配送”

大對象（超過 Region 50%）直接進入老年代，類似超重訂單需特殊車輛處理。通過G1HeapRegionSize調整 Region 大小（如 32MB），或設置PretenureSizeThreshold控制大對象閾值，減少內存碎片。

Full GC 的應急處理

內存不足：堆內存過小或老年代晉升過快，需檢查-Xmx/-Xms是否一致（建議設為物理內存 75%-80%）。

并發失敗：若 Mixed GC 無法及時回收，觸發 Full GC，需優化MaxGCPauseMillis或降低InitiatingHeapOccupancyPercent。

啟用 GC 日志：-XX:+PrintGCDetails -Xloggc:/path/gc.log，關注Full GC關鍵字及耗時。

關鍵調優參數

-XX:MaxGCPauseMillis：設定最大停頓時間（默認 200ms），G1 根據此目標動態調整回收 Region 數量.
-XX:G1HeapRegionSize：手動指定 Region 大小（需為 2 的冪次方）。
-XX:G1MixedGCCountTarget：控制混合回收次數（默認 8 次），分批次回收老年代 Region 以減少單次停頓。
-XX:G1ReservePercent：預留堆內存（默認 10%）防止晉升失敗。

總結

G1 是一款非常優秀的垃圾收集器，不僅適合堆內存大的應用，同時也簡化了調優的工作。通過主要的參數初始和最大堆空間、以及最大容忍的 GC 暫停目標，就能得到不錯的性能；同時，我們也看到 G1 對內存空間的浪費較高，但通過首先收集盡可能多的垃圾(Garbage First)的設計原則，可以及時發現過期對象，從而讓內存占用處于合理的水平。

雖然 G1 也有類似 CMS 的收集動作：初始標記、并發標記、重新標記、清除、轉移回收，并且也以一個串行收集器做擔保機制，但單純地以類似前三種的過程描述顯得并不是很妥當。

G1 的設計原則是"首先收集盡可能多的垃圾(Garbage First)"。因此，G1 并不會等內存耗盡(串行、并行)或者快耗盡(CMS)的時候開始垃圾收集，而是在內部采用了啟發式算法，在老年代找出具有高收集收益的分區進行收集。同時 G1 可以根據用戶設置的暫停時間目標自動調整年輕代和總堆大小，暫停目標越短年輕代空間越小、總空間就越大；
G1 采用內存分區(Region)的思路，將內存劃分為一個個相等大小的內存分區，回收時則以分區為單位進行回收，存活的對象復制到另一個空閑分區中。由于都是以相等大小的分區為單位進行操作，因此 G1 天然就是一種壓縮方案(局部壓縮)；
G1 雖然也是分代收集器，但整個內存分區不存在物理上的年輕代與老年代的區別，也不需要完全獨立的 survivor(to space)堆做復制準備。G1 只有邏輯上的分代概念，或者說每個分區都可能隨 G1 的運行在不同代之間前后切換；
G1 的收集都是 STW 的，但年輕代和老年代的收集界限比較模糊，采用了混合(mixed)收集的方式。即每次收集既可能只收集年輕代分區(年輕代收集)，也可能在收集年輕代的同時，包含部分老年代分區(混合收集)，這樣即使堆內存很大時，也可以限制收集范圍，從而降低停頓。

責任編輯：姜華來源：碼哥跳動

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看