Parallel 垃圾回收器(也稱為?吞吐量優先收集器)。它是 Java 早期(特別是 JDK 8 及之前)在多核處理器上的默認垃圾回收器,其核心設計目標是最大化應用程序的吞吐量。
一、Parallel 回收器的定位與設計目標
-
核心目標:高吞吐量 (High Throughput)
-
吞吐量定義:?應用程序運行時間占總時間(應用程序運行時間 + 垃圾回收時間)的比例。
吞吐量 = 應用運行時間 / (應用運行時間 + GC 時間) * 100%
。 -
設計哲學:?為了最大化應用代碼的執行效率,它愿意使用更長時間的?Stop-The-World (STW)?停頓,換取在應用運行時階段更高的效率和更短的總運行時間。它假設應用可以容忍較長的、但次數較少的 GC 停頓。
-
-
實現方式:并行處理
-
充分利用多核 CPU 的優勢,在 STW 期間,使用多個 GC 線程并行執行垃圾回收任務(標記、復制/清除、整理),從而加快單次 GC 的速度。
-
注意:?這里的“并行”(Parallel) 指的是?GC 線程之間的并行(多個 GC 線程同時工作),不是?GC 線程與應用程序線程的并發(Concurrent)。Parallel 回收器在進行垃圾回收時,必須暫停所有應用線程 (STW)。
-
-
分代收集:?遵循分代假說,將堆劃分為年輕代 (Young Generation) 和老年代 (Old Generation),并分別使用不同的并行回收器:
-
年輕代:?
Parallel Scavenge
?(并行復制) -
老年代:?
Parallel Old
?(并行標記-整理) (在 JDK 6u18 之前,老年代搭配的是單線程的?Serial Old
,之后?Parallel Old
?成為標準搭配)
-
-
適用場景:
-
適合后臺計算密集型任務,如科學計算、批處理作業、報表生成等。
-
應用對吞吐量要求極高,對單個 GC 停頓時間不太敏感(可以接受幾百毫秒甚至秒級的停頓)。
-
運行在多核/多 CPU 的服務器上。
-
二、核心組件與算法
-
年輕代:Parallel Scavenge (并行復制)
-
算法:?復制算法 (Copying)
-
堆結構:?年輕代劃分為一個較大的?
Eden
?區和兩個較小的?Survivor
?區 (From
,?To
)。默認比例?Eden : Survivor = 8:1
?(可通過?-XX:SurvivorRatio
?調整)。 -
回收過程 (STW):
-
觸發條件:Eden 區滿。
-
STW:?暫停所有應用線程。
-
并行標記:?多個 GC 線程并行地從 GC Roots 出發,標記 Eden 區和當前?
From
?Survivor 區中的存活對象。 -
并行復制:?多個 GC 線程并行地將標記出的存活對象復制到?
To
?Survivor 區。-
新對象直接在 Eden 區分配。
-
對象在 Survivor 區之間每熬過一次 GC,年齡增加 1。
-
達到晉升年齡閾值 (
-XX:MaxTenuringThreshold
) 的對象會被晉升 (Promote)?到老年代。 -
如果?
To
?Survivor 區空間不足以容納所有存活對象,或者存活對象年齡過大,會直接晉升到老年代。
-
-
清空與交換:?清空 Eden 區和剛使用完的?
From
?Survivor 區。交換?From
?和?To
?的角色(下次 GC 時,當前的?To
?變成新的?From
)。
-
-
特點:?高效、簡單,沒有內存碎片。STW 時間與存活對象數量成正比。
-
-
老年代:Parallel Old (并行標記-整理)
-
算法:?標記-整理 (Mark-Compact)
-
回收過程 (STW):
-
觸發條件:
-
顯式調用?
System.gc()
?(通常不建議)。 -
老年代空間不足(例如,年輕代晉升失敗,或者大對象直接進入老年代導致空間不足)。
-
元空間 (Metaspace) / 永久代 (PermGen) 空間不足(會連帶觸發 Full GC)。
-
-
STW:?暫停所有應用線程。
-
并行標記:?多個 GC 線程并行地從 GC Roots 出發,遞歸遍歷對象圖,標記老年代中所有存活對象。
-
并行計算整理位置:?多個 GC 線程并行地計算每個存活對象在整理后應該移動到的目標地址(通常是基于區域劃分,每個線程負責一塊連續區域)。
-
并行整理:?多個 GC 線程并行地根據上一步計算出的目標地址,將存活對象復制(移動)到新的位置。這相當于將存活對象“滑動”到堆的一端。
-
并行清除:?多個 GC 線程并行地更新所有指向被移動對象的引用(指針)。最后,清除掉整理后邊界以外的所有空間(即死亡對象占用的空間)。
-
-
特點:
-
解決了內存碎片問題:?整理過程將存活對象緊密排列在堆的一端,騰出大塊的連續空間,消除了內存碎片。
-
STW 時間較長:?整個標記-整理過程需要在 STW 下完成,且涉及全堆掃描和對象移動,對于大堆來說停頓時間可能相當可觀(秒級)。
-
吞吐量高:?并行化極大地加速了整個回收過程,相比單線程的 Serial Old 快很多。
-
-
三、核心特性與優勢
-
高吞吐量:?這是其最主要也是最大的優勢。通過并行化 GC 任務,最大限度地減少了 GC 本身所占用的時間(盡管每次停頓時間長,但頻率相對較低),使得應用線程有更多的時間執行業務邏輯,特別適合需要處理大量數據、完成繁重計算任務的場景。
-
高效利用多核 CPU:?在 STW 期間,它能讓所有可用的 CPU 核心全力投入垃圾回收工作,充分利用硬件資源加速 GC。
-
內存碎片控制 (Parallel Old):?老年代使用標記-整理算法,避免了像 CMS 那樣的內存碎片問題,不會因為碎片導致分配失敗而觸發更耗時的 Full GC。
-
成熟穩定:?作為 JDK 8 及之前的默認回收器,經過長期發展和優化,非常成熟穩定。
四、缺點與挑戰
-
較長的 STW 停頓時間:?這是追求高吞吐量付出的代價。無論是年輕代的 Parallel Scavenge 還是老年代的 Parallel Old,在進行回收時都必須暫停所有應用線程,且停頓時間會隨著堆大小的增加而增加。這對于需要低延遲、快速響應的應用(如 Web 服務、實時交易系統)是不可接受的。
-
暫停時間不可預測:?停頓時間的長短主要取決于堆中存活對象的數量和堆的大小,不像 G1 或 CMS 那樣有明確的停頓時間目標模型。停頓時間波動可能較大。
-
缺乏并發性:?GC 線程與應用線程不能同時工作。在 GC 發生時,應用完全停止。
-
調優相對復雜 (主要針對吞吐量目標):
-
需要平衡堆大小、各代比例與 GC 頻率/停頓時間的關系。
-
核心調優參數圍繞吞吐量和停頓時間目標設定。
-
五、關鍵配置參數
-
啟用 Parallel 回收器:
-
JDK 8 及之前:默認啟用。或顯式指定?
-XX:+UseParallelGC
?(啟用 Parallel Scavenge + Serial Old)?或?-XX:+UseParallelOldGC
?(啟用 Parallel Scavenge + Parallel Old, 推薦)。在 JDK 8 中,UseParallelGC
?默認會激活?UseParallelOldGC
。 -
JDK 9+:不再是默認回收器 (G1 是默認),需顯式指定?
-XX:+UseParallelGC
?或?-XX:+UseParallelOldGC
。
-
-
設置 GC 線程數:
-
-XX:ParallelGCThreads=<n>
: 設置用于年輕代和老年代并行 GC 的線程數。默認值通常等于 CPU 核心數。對于 CPU 密集型應用,設置接近核心數可最大化并行效率;對于 IO 密集型或 CPU 核心非常多的情況,可以適當減少以避免過度切換。
-
-
吞吐量目標 (首要目標):
-
-XX:GCTimeRatio=<ratio>
:?最重要的吞吐量控制參數。?設置期望的?GC 時間與應用程序時間之比。公式為?應用運行時間 = GCTimeRatio * GC 時間
。默認值?99
?表示?應用時間 : GC 時間 = 99 : 1
,即吞吐量目標為?99%
?(1 - 1/(1+99) = 0.99
)。增大此值(如 99 -> 199)表示允許更少的 GC 時間(更高的吞吐量),JVM 會嘗試通過增大堆空間(減少 GC 頻率)或更激進地回收(可能增加單次停頓時間)來實現。
-
-
最大 GC 停頓時間目標 (次要目標/軟目標):
-
-XX:MaxGCPauseMillis=<ms>
: 設置期望的每次 GC 停頓的最大毫秒數。這是一個軟目標 (Soft Goal),JVM 會盡力達成,但不保證絕對滿足,且優先級低于?GCTimeRatio
。默認值不設置。設置一個合理的值(如 100-500ms)可以指導 JVM 調整堆和代的大小(例如,為了減少單次停頓時間,可能會縮小年輕代,導致更頻繁但更短的 Young GC)。
-
-
堆大小與代大小:
-
-Xms
?/?-Xmx
: 設置堆的初始大小和最大大小。通常設置為相同值以避免堆大小動態調整的開銷,這對吞吐量應用很關鍵。 -
-XX:NewRatio=<ratio>
: 設置老年代與年輕代的比例。例如?-XX:NewRatio=3
?表示?老年代:年輕代 = 3:1
?(年輕代占堆的 1/4)。 -
-XX:NewSize=<size>
?/?-XX:MaxNewSize=<size>
: 直接設置年輕代的初始大小和最大大小 (優先級高于?NewRatio
)。 -
-XX:SurvivorRatio=<ratio>
: 設置 Eden 區與一個 Survivor 區的比例。例如?-XX:SurvivorRatio=8
?表示?Eden : Survivor = 8:1
?(每個 Survivor 占年輕代的 1/10)。
-
-
晉升年齡控制:
-
-XX:MaxTenuringThreshold=<age>
: 設置對象晉升到老年代前在年輕代經歷的最大 GC 次數(年齡)。默認值?15
。增大此值可以讓對象在年輕代停留更久,減少晉升到老年代的數量,從而減少 Full GC 頻率。但設置過大可能導致 Survivor 區溢出或對象在多次 Young GC 中反復復制。
-
六、調優注意事項
-
優先保障吞吐量 (
GCTimeRatio
):?這是 Parallel 回收器的核心目標。調優應首先關注?GCTimeRatio
?是否達到預期。 -
合理設置堆大小 (
-Xms
=-Xmx
):?足夠大的堆可以減少 GC 頻率。但過大的堆會導致單次 GC 停頓時間更長。找到平衡點。 -
監控 GC 日志:?使用?
-Xlog:gc*
?(JDK 9+) 或?-verbose:gc
?+?-XX:+PrintGCDetails
?+?-XX:+PrintGCDateStamps
?(JDK 8) 等參數輸出詳細 GC 日志。分析:-
實際吞吐量 (
應用時間 / 總時間
)。 -
Young GC / Full GC 的頻率和平均/最大停頓時間。
-
各代空間占用情況、晉升情況。
-
-
理解?
MaxGCPauseMillis
?的副作用:?為了達到更短的停頓目標,JVM 可能會:-
縮小年輕代 → 增加 Young GC 頻率(雖然每次短了,但總次數多了)。
-
降低晉升年齡閾值 → 增加晉升到老年代的對象 → 增加 Full GC 頻率。
-
這些調整可能損害吞吐量 (
GCTimeRatio
)!?設置?MaxGCPauseMillis
?需謹慎,并監控其對吞吐量的影響。
-
-
避免過早晉升:?確保 Survivor 區足夠大 (
SurvivorRatio
),并且?MaxTenuringThreshold
?設置合理,避免大量“朝生夕死”的對象過早進入老年代觸發 Full GC。
七、與 CMS/G1/ZGC/Shenandoah 的對比
-
vs CMS:?CMS 追求低延遲(減少 STW 時間),使用并發標記清除(有碎片問題)。Parallel 追求高吞吐量,使用并行 STW 回收(無碎片)。CMS 在 JDK 14+ 已移除。
-
vs G1:?G1 也利用并行性,但核心目標是可預測的低停頓,同時兼顧高吞吐量。它采用 Region 化堆和部分回收,支持并發標記,停頓時間模型更可控。G1 是 JDK 9+ 的默認回收器,更適合需要平衡吞吐量和延遲的大堆應用。
-
vs ZGC / Shenandoah:?新一代超低延遲回收器,停頓時間目標是?亞毫秒級 (<10ms),且幾乎不隨堆大小增長。它們使用了染色指針、讀屏障等更先進的技術實現高度并發。適用于超大堆和極致延遲要求的場景。它們也追求高吞吐量,但在極高吞吐量場景下,Parallel 可能仍有微弱的理論優勢(因為并發回收器有運行時屏障開銷)。
八、總結
Parallel 垃圾回收器(Parallel Scavenge + Parallel Old)是 JVM 中經典的吞吐量優先解決方案。其核心優勢在于:
-
最大化應用程序吞吐量:?通過并行化 STW 期間的垃圾回收任務,充分利用多核 CPU 資源,最小化 GC 本身占用的總時間。
-
高效穩定:?成熟可靠,特別適合計算密集型、批處理型應用。
-
內存整理 (Parallel Old):?避免老年代碎片問題。
其主要代價是:
-
較長的、不可預測的 STW 停頓:?不適合延遲敏感型應用。
-
缺乏并發處理能力。
適用場景:?當應用的核心需求是用最短的總時間完成盡可能多的工作任務(高吞吐量),并且可以容忍秒級或幾百毫秒級的、偶發的暫停(如后臺報表生成、科學計算、離線數據分析)時,Parallel 回收器是一個非常好的選擇,尤其是在 JDK 8 環境中。在新版本 JDK (9+) 中,雖然 G1 是默認且更通用,但如果吞吐量是絕對優先指標且停頓可接受,Parallel 仍然是值得考慮的選項。對于需要極低延遲或超大堆的應用,則應考慮 G1、ZGC 或 Shenandoah。