JVM(10)——詳解Parallel垃圾回收器

Parallel 垃圾回收器（也稱為?吞吐量優先收集器）。它是 Java 早期（特別是 JDK 8 及之前）在多核處理器上的默認垃圾回收器，其核心設計目標是最大化應用程序的吞吐量。

一、Parallel 回收器的定位與設計目標

核心目標：高吞吐量 (High Throughput)
- 吞吐量定義：?應用程序運行時間占總時間（應用程序運行時間 + 垃圾回收時間）的比例。吞吐量 = 應用運行時間 / (應用運行時間 + GC 時間) * 100%。
- 設計哲學：?為了最大化應用代碼的執行效率，它愿意使用更長時間的?Stop-The-World (STW)?停頓，換取在應用運行時階段更高的效率和更短的總運行時間。它假設應用可以容忍較長的、但次數較少的 GC 停頓。
實現方式：并行處理
- 充分利用多核 CPU 的優勢，在 STW 期間，使用多個 GC 線程并行執行垃圾回收任務（標記、復制/清除、整理），從而加快單次 GC 的速度。
- 注意：?這里的“并行”(Parallel) 指的是?GC 線程之間的并行（多個 GC 線程同時工作），不是?GC 線程與應用程序線程的并發(Concurrent)。Parallel 回收器在進行垃圾回收時，必須暫停所有應用線程 (STW)。
分代收集：?遵循分代假說，將堆劃分為年輕代 (Young Generation) 和老年代 (Old Generation)，并分別使用不同的并行回收器：
- 年輕代：?Parallel Scavenge?(并行復制)
- 老年代：?Parallel Old?(并行標記-整理) (在 JDK 6u18 之前，老年代搭配的是單線程的?Serial Old，之后?Parallel Old?成為標準搭配)
適用場景：
- 適合后臺計算密集型任務，如科學計算、批處理作業、報表生成等。
- 應用對吞吐量要求極高，對單個 GC 停頓時間不太敏感（可以接受幾百毫秒甚至秒級的停頓）。
- 運行在多核/多 CPU 的服務器上。

二、核心組件與算法

年輕代：Parallel Scavenge (并行復制)
- 算法：?復制算法 (Copying)
- 堆結構：?年輕代劃分為一個較大的?Eden?區和兩個較小的?Survivor?區 (From,?To)。默認比例?Eden : Survivor = 8:1?(可通過?-XX:SurvivorRatio?調整)。
- 回收過程 (STW)：
  1. 觸發條件：Eden 區滿。
  2. STW：?暫停所有應用線程。
  3. 并行標記：?多個 GC 線程并行地從 GC Roots 出發，標記 Eden 區和當前?From?Survivor 區中的存活對象。
  4. 并行復制：?多個 GC 線程并行地將標記出的存活對象復制到?To?Survivor 區。
    - 新對象直接在 Eden 區分配。
    - 對象在 Survivor 區之間每熬過一次 GC，年齡增加 1。
    - 達到晉升年齡閾值 (-XX:MaxTenuringThreshold) 的對象會被晉升 (Promote)?到老年代。
    - 如果?To?Survivor 區空間不足以容納所有存活對象，或者存活對象年齡過大，會直接晉升到老年代。
  5. 清空與交換：?清空 Eden 區和剛使用完的?From?Survivor 區。交換?From?和?To?的角色（下次 GC 時，當前的?To?變成新的?From）。
- 特點：?高效、簡單，沒有內存碎片。STW 時間與存活對象數量成正比。
老年代：Parallel Old (并行標記-整理)
- 算法：?標記-整理 (Mark-Compact)
- 回收過程 (STW)：
  1. 觸發條件：
    - 顯式調用?System.gc()?(通常不建議)。
    - 老年代空間不足（例如，年輕代晉升失敗，或者大對象直接進入老年代導致空間不足）。
    - 元空間 (Metaspace) / 永久代 (PermGen) 空間不足（會連帶觸發 Full GC）。
  2. STW：?暫停所有應用線程。
  3. 并行標記：?多個 GC 線程并行地從 GC Roots 出發，遞歸遍歷對象圖，標記老年代中所有存活對象。
  4. 并行計算整理位置：?多個 GC 線程并行地計算每個存活對象在整理后應該移動到的目標地址（通常是基于區域劃分，每個線程負責一塊連續區域）。
  5. 并行整理：?多個 GC 線程并行地根據上一步計算出的目標地址，將存活對象復制（移動）到新的位置。這相當于將存活對象“滑動”到堆的一端。
  6. 并行清除：?多個 GC 線程并行地更新所有指向被移動對象的引用（指針）。最后，清除掉整理后邊界以外的所有空間（即死亡對象占用的空間）。
- 特點：
  - 解決了內存碎片問題：?整理過程將存活對象緊密排列在堆的一端，騰出大塊的連續空間，消除了內存碎片。
  - STW 時間較長：?整個標記-整理過程需要在 STW 下完成，且涉及全堆掃描和對象移動，對于大堆來說停頓時間可能相當可觀（秒級）。
  - 吞吐量高：?并行化極大地加速了整個回收過程，相比單線程的 Serial Old 快很多。

三、核心特性與優勢

高吞吐量：?這是其最主要也是最大的優勢。通過并行化 GC 任務，最大限度地減少了 GC 本身所占用的時間（盡管每次停頓時間長，但頻率相對較低），使得應用線程有更多的時間執行業務邏輯，特別適合需要處理大量數據、完成繁重計算任務的場景。
高效利用多核 CPU：?在 STW 期間，它能讓所有可用的 CPU 核心全力投入垃圾回收工作，充分利用硬件資源加速 GC。
內存碎片控制 (Parallel Old)：?老年代使用標記-整理算法，避免了像 CMS 那樣的內存碎片問題，不會因為碎片導致分配失敗而觸發更耗時的 Full GC。
成熟穩定：?作為 JDK 8 及之前的默認回收器，經過長期發展和優化，非常成熟穩定。

四、缺點與挑戰

較長的 STW 停頓時間：?這是追求高吞吐量付出的代價。無論是年輕代的 Parallel Scavenge 還是老年代的 Parallel Old，在進行回收時都必須暫停所有應用線程，且停頓時間會隨著堆大小的增加而增加。這對于需要低延遲、快速響應的應用（如 Web 服務、實時交易系統）是不可接受的。
暫停時間不可預測：?停頓時間的長短主要取決于堆中存活對象的數量和堆的大小，不像 G1 或 CMS 那樣有明確的停頓時間目標模型。停頓時間波動可能較大。
缺乏并發性：?GC 線程與應用線程不能同時工作。在 GC 發生時，應用完全停止。
調優相對復雜 (主要針對吞吐量目標)：
- 需要平衡堆大小、各代比例與 GC 頻率/停頓時間的關系。
- 核心調優參數圍繞吞吐量和停頓時間目標設定。

五、關鍵配置參數

啟用 Parallel 回收器：
- JDK 8 及之前：默認啟用。或顯式指定?-XX:+UseParallelGC?(啟用 Parallel Scavenge + Serial Old)?或?-XX:+UseParallelOldGC?(啟用 Parallel Scavenge + Parallel Old, 推薦)。在 JDK 8 中，UseParallelGC?默認會激活?UseParallelOldGC。
- JDK 9+：不再是默認回收器 (G1 是默認)，需顯式指定?-XX:+UseParallelGC?或?-XX:+UseParallelOldGC。
設置 GC 線程數：
- -XX:ParallelGCThreads=<n>: 設置用于年輕代和老年代并行 GC 的線程數。默認值通常等于 CPU 核心數。對于 CPU 密集型應用，設置接近核心數可最大化并行效率；對于 IO 密集型或 CPU 核心非常多的情況，可以適當減少以避免過度切換。
吞吐量目標 (首要目標)：
- -XX:GCTimeRatio=<ratio>:?最重要的吞吐量控制參數。?設置期望的?GC 時間與應用程序時間之比。公式為?應用運行時間 = GCTimeRatio * GC 時間。默認值?99?表示?應用時間 : GC 時間 = 99 : 1，即吞吐量目標為?99%?(1 - 1/(1+99) = 0.99)。增大此值（如 99 -> 199）表示允許更少的 GC 時間（更高的吞吐量），JVM 會嘗試通過增大堆空間（減少 GC 頻率）或更激進地回收（可能增加單次停頓時間）來實現。
最大 GC 停頓時間目標 (次要目標/軟目標)：
- -XX:MaxGCPauseMillis=<ms>: 設置期望的每次 GC 停頓的最大毫秒數。這是一個軟目標 (Soft Goal)，JVM 會盡力達成，但不保證絕對滿足，且優先級低于?GCTimeRatio。默認值不設置。設置一個合理的值（如 100-500ms）可以指導 JVM 調整堆和代的大小（例如，為了減少單次停頓時間，可能會縮小年輕代，導致更頻繁但更短的 Young GC）。
堆大小與代大小：
- -Xms?/?-Xmx: 設置堆的初始大小和最大大小。通常設置為相同值以避免堆大小動態調整的開銷，這對吞吐量應用很關鍵。
- -XX:NewRatio=<ratio>: 設置老年代與年輕代的比例。例如?-XX:NewRatio=3?表示?老年代:年輕代 = 3:1?(年輕代占堆的 1/4)。
- -XX:NewSize=<size>?/?-XX:MaxNewSize=<size>: 直接設置年輕代的初始大小和最大大小 (優先級高于?NewRatio)。
- -XX:SurvivorRatio=<ratio>: 設置 Eden 區與一個 Survivor 區的比例。例如?-XX:SurvivorRatio=8?表示?Eden : Survivor = 8:1?(每個 Survivor 占年輕代的 1/10)。
晉升年齡控制：
- -XX:MaxTenuringThreshold=<age>: 設置對象晉升到老年代前在年輕代經歷的最大 GC 次數（年齡）。默認值?15。增大此值可以讓對象在年輕代停留更久，減少晉升到老年代的數量，從而減少 Full GC 頻率。但設置過大可能導致 Survivor 區溢出或對象在多次 Young GC 中反復復制。

六、調優注意事項

優先保障吞吐量 (GCTimeRatio):?這是 Parallel 回收器的核心目標。調優應首先關注?GCTimeRatio?是否達到預期。
合理設置堆大小 (-Xms=-Xmx):?足夠大的堆可以減少 GC 頻率。但過大的堆會導致單次 GC 停頓時間更長。找到平衡點。
監控 GC 日志：?使用?-Xlog:gc*?(JDK 9+) 或?-verbose:gc?+?-XX:+PrintGCDetails?+?-XX:+PrintGCDateStamps?(JDK 8) 等參數輸出詳細 GC 日志。分析：
- 實際吞吐量 (應用時間 / 總時間)。
- Young GC / Full GC 的頻率和平均/最大停頓時間。
- 各代空間占用情況、晉升情況。
理解?MaxGCPauseMillis?的副作用：?為了達到更短的停頓目標，JVM 可能會：
- 縮小年輕代 → 增加 Young GC 頻率（雖然每次短了，但總次數多了）。
- 降低晉升年齡閾值 → 增加晉升到老年代的對象 → 增加 Full GC 頻率。
- 這些調整可能損害吞吐量 (GCTimeRatio)！?設置?MaxGCPauseMillis?需謹慎，并監控其對吞吐量的影響。
避免過早晉升：?確保 Survivor 區足夠大 (SurvivorRatio)，并且?MaxTenuringThreshold?設置合理，避免大量“朝生夕死”的對象過早進入老年代觸發 Full GC。

七、與 CMS/G1/ZGC/Shenandoah 的對比

vs CMS：?CMS 追求低延遲（減少 STW 時間），使用并發標記清除（有碎片問題）。Parallel 追求高吞吐量，使用并行 STW 回收（無碎片）。CMS 在 JDK 14+ 已移除。
vs G1：?G1 也利用并行性，但核心目標是可預測的低停頓，同時兼顧高吞吐量。它采用 Region 化堆和部分回收，支持并發標記，停頓時間模型更可控。G1 是 JDK 9+ 的默認回收器，更適合需要平衡吞吐量和延遲的大堆應用。
vs ZGC / Shenandoah：?新一代超低延遲回收器，停頓時間目標是?亞毫秒級 (<10ms)，且幾乎不隨堆大小增長。它們使用了染色指針、讀屏障等更先進的技術實現高度并發。適用于超大堆和極致延遲要求的場景。它們也追求高吞吐量，但在極高吞吐量場景下，Parallel 可能仍有微弱的理論優勢（因為并發回收器有運行時屏障開銷）。

八、總結

Parallel 垃圾回收器（Parallel Scavenge + Parallel Old）是 JVM 中經典的吞吐量優先解決方案。其核心優勢在于：

最大化應用程序吞吐量：?通過并行化 STW 期間的垃圾回收任務，充分利用多核 CPU 資源，最小化 GC 本身占用的總時間。
高效穩定：?成熟可靠，特別適合計算密集型、批處理型應用。
內存整理 (Parallel Old)：?避免老年代碎片問題。

其主要代價是：

較長的、不可預測的 STW 停頓：?不適合延遲敏感型應用。
缺乏并發處理能力。

適用場景：?當應用的核心需求是用最短的總時間完成盡可能多的工作任務（高吞吐量），并且可以容忍秒級或幾百毫秒級的、偶發的暫停（如后臺報表生成、科學計算、離線數據分析）時，Parallel 回收器是一個非常好的選擇，尤其是在 JDK 8 環境中。在新版本 JDK (9+) 中，雖然 G1 是默認且更通用，但如果吞吐量是絕對優先指標且停頓可接受，Parallel 仍然是值得考慮的選項。對于需要極低延遲或超大堆的應用，則應考慮 G1、ZGC 或 Shenandoah。