G1与Parallel GC的详细对比：Java垃圾收集器全面解析

一、基本原理与设计目标

1.1 Parallel GC概述

Parallel GC（也称为Parallel Collector或Throughput Collector）是JDK 1.5引入的垃圾收集器，作为早期Serial收集器的多线程版本，它的主要设计目标是最大化应用程序的吞吐量。

核心特点：

多线程并行执行垃圾收集
采用标记-复制（年轻代）和标记-整理（老年代）算法
关注整体吞吐量，而非单次停顿时间
全局停顿（Stop-The-World）操作

设计理念：Parallel GC基于这样一种假设 - 在某些应用场景中，短暂的停顿是可以接受的，只要总体上能够最大化应用程序的工作时间（即吞吐量）。

1.2 G1 GC概述

G1（Garbage-First）收集器是JDK 1.7引入并在JDK 9中成为默认收集器的新一代垃圾收集器，其设计目标是在保证高吞吐量的同时，尽可能地减少垃圾收集的停顿时间。

核心特点：

区域化内存布局（Region-based）
可预测的停顿时间模型
增量式垃圾收集
混合式回收（Mixed GC）
并发标记与并行收集相结合

设计理念：G1的设计理念是"垃圾优先"，即优先回收垃圾最多的区域，这样可以在有限的时间内获得最大的收集效果。G1尝试在吞吐量和停顿时间之间取得平衡，特别适合需要较低延迟的大内存应用。

1.3 设计目标对比

特性	Parallel GC	G1 GC
主要优化目标	吞吐量（Throughput）	停顿时间（Latency）
次要优化目标	内存利用率	吞吐量
适用堆内存大小	中小型（<4GB）	中大型（>4GB）
JDK版本支持	JDK 1.5+	JDK 1.7+（JDK 9默认）
GC停顿特性	较长但频率低	较短但频率可能较高
内存碎片处理	标记-整理（老年代）	复制+整理（全区域）

二、内存布局与区域划分

2.1 Parallel GC的内存布局

Parallel GC采用了传统的分代垃圾收集思想，将Java堆分为三个主要区域：

年轻代（Young Generation）
- Eden区：新对象分配的区域
- Survivor区（From和To）：存活对象在Minor GC后转移的区域
老年代（Old Generation）：存放长期存活的对象
永久代/元空间：存放类元数据（JDK 8后改为元空间，使用本地内存）

内存布局特点：

固定的分代比例（可通过参数调整）
连续的内存空间
全局性的垃圾收集

2.2 G1 GC的内存布局

G1 GC打破了传统的分代模型，采用了全新的区域化（Region-based）内存布局：

区域（Region）：G1将整个堆空间划分为大小相等的区域（默认2048个区域，每个1-32MB）
逻辑分代：
- 年轻代区域：Eden区域和Survivor区域
- 老年代区域：存放长期存活对象
- Humongous区域：专门用于存储大对象（超过区域大小50%的对象）
记忆集（Remembered Sets）：每个区域都有一个记忆集，用于记录指向该区域的对象引用
收集集合（Collection Set）：每次GC时被选中回收的区域集合

内存布局特点：

动态调整各代区域数量
非连续的内存空间管理
区域化的增量回收

2.3 内存布局对比图


【Parallel GC内存布局】
+---------------------------+
|        Eden Space         |
+-------------+-------------+
| Survivor    | Survivor    |
| From        | To          |
+-------------+-------------+
|                           |
|        Old Generation     |
|                           |
+---------------------------+
|      Permanent Generation/|
|      Metaspace            |
+---------------------------+

【G1 GC内存布局】
+---+---+---+---+---+---+---+
| E | E | E | O | O | H | H |
+---+---+---+---+---+---+---+
| E | S | O | O | H | O | O |
+---+---+---+---+---+---+---+
| S | O | O | E | E | E | O |
+---+---+---+---+---+---+---+
| O | O | E | E | O | O | O |
+---+---+---+---+---+---+---+
E: Eden区域  S: Survivor区域
O: Old区域   H: Humongous区域

2.4 内存布局差异对比

特性	Parallel GC	G1 GC
内存划分方式	连续的分代空间	不连续的区域化空间
内存区域大小	各代大小固定（可调）	区域大小相等，数量可变
大对象处理	直接进入老年代	使用特殊的Humongous区域
内存使用效率	较高（连续空间）	略低（有区域间隙）
内存碎片问题	老年代可能产生	较少（区域化管理）
动态调整能力	有限	强（可动态调整各代区域数量）

三、垃圾回收算法与过程

3.1 Parallel GC的回收算法与过程

3.1.1 年轻代回收（Minor GC）

算法：标记-复制（Mark-Copy）

过程：

触发条件：Eden区空间不足
停止所有应用线程（Stop-The-World）
多线程并行标记Eden和From区中的存活对象
将存活对象复制到To区
对象年龄增加，达到阈值则晋升到老年代
清空Eden和From区
交换From和To区角色
恢复应用线程

3.1.2 老年代回收（Major GC/Full GC）

算法：标记-整理（Mark-Compact）

过程：

触发条件：老年代空间不足
停止所有应用线程（Stop-The-World）
多线程并行标记整个堆中的存活对象
清除未标记对象
整理老年代空间，减少碎片
恢复应用线程

特点：

全堆扫描，停顿时间长
吞吐量高，但延迟大
内存整理过程耗时

3.2 G1 GC的回收算法与过程

3.2.1 年轻代回收（Young GC）

算法：标记-复制（Mark-Copy）

过程：

触发条件：Eden区域占用达到阈值
停止所有应用线程（Stop-The-World）
多线程并行标记Eden和Survivor区域中的存活对象
将存活对象复制到新的Survivor区域
对象年龄增加，达到阈值则晋升到老年代区域
回收原Eden和Survivor区域
恢复应用线程

3.2.2 混合回收（Mixed GC）

算法：增量标记-复制（Incremental Mark-Copy）

过程：

初始标记（Initial Mark）：标记GC Roots直接关联的对象（STW）
并发标记（Concurrent Mark）：与应用并发执行，标记整个堆中的存活对象
最终标记（Final Mark）：处理并发标记阶段的遗漏标记（STW）
筛选回收（Live Data Counting and Evacuation）：选择垃圾最多的区域进行回收（STW）

特点：

并发执行大部分标记工作
增量式回收，每次只处理部分区域
可预测的停顿时间模型
优先回收垃圾最多的区域（Garbage-First）

3.3 回收算法对比

特性	Parallel GC	G1 GC
年轻代算法	标记-复制	标记-复制（区域化）
老年代算法	标记-整理	增量标记-复制
并发标记	不支持	支持
增量回收	不支持	支持
回收粒度	整代回收	区域回收
回收策略	全量回收	垃圾优先回收
停顿时间	不可预测	可预测（-XX ）
内存碎片	老年代可能产生	较少（复制算法）

四、停顿时间与吞吐量性能对比

4.1 停顿时间（Latency）

停顿时间是指垃圾收集器在执行GC时，应用程序线程被暂停的时间。

4.1.1 实测数据对比

测试环境：

16GB堆内存
8核CPU
模拟电商交易系统负载

收集器	平均停顿时间	最大停顿时间	95%停顿时间	停顿频率
Parallel GC	280ms	1200ms	520ms	低
G1 GC	85ms	320ms	150ms	中

4.1.2 不同堆大小下的停顿时间变化

堆大小	Parallel GC平均停顿	G1 GC平均停顿
2GB	120ms	60ms
4GB	180ms	70ms
8GB	240ms	80ms
16GB	280ms	85ms
32GB	450ms	95ms

结论：随着堆内存增大，Parallel GC的停顿时间增长明显，而G1 GC的停顿时间增长相对平缓。

4.2 吞吐量（Throughput）

吞吐量是指应用程序运行时间占总时间（应用运行时间+GC时间）的比例。

4.2.1 实测数据对比

测试环境：同上

收集器	吞吐量	GC时间占比	每分钟处理事务数
Parallel GC	98.5%	1.5%	12,500
G1 GC	97.2%	2.8%	11,800

4.2.2 不同负载下的吞吐量变化

负载类型	Parallel GC吞吐量	G1 GC吞吐量
低内存分配率	99.2%	98.8%
中内存分配率	98.5%	97.2%
高内存分配率	95.8%	94.5%
极高内存分配率	90.2%	92.1%

结论：在大多数场景下，Parallel GC的吞吐量略高于G1 GC，但在极高内存分配率的场景下，G1 GC可能表现更好。

4.3 内存占用与CPU消耗

指标	Parallel GC	G1 GC
元数据开销	低	高（记忆集等）
CPU使用率	低（仅GC线程）	高（并发标记）
GC线程数量	并行阶段活跃	并发+并行阶段活跃
额外内存消耗	约5%	约10-15%

4.4 实际应用场景性能对比

4.4.1 批处理应用

特点：高吞吐量，对延迟不敏感

收集器	处理速度	资源消耗	总体评分
Parallel GC	★★★★★	★★★★☆	推荐
G1 GC	★★★☆☆	★★★☆☆	可用

4.4.2 交互式应用

特点：对延迟敏感，需要快速响应

收集器	响应时间	用户体验	总体评分
Parallel GC	★★☆☆☆	★★☆☆☆	不推荐
G1 GC	★★★★☆	★★★★☆	推荐

4.4.3 大内存服务器应用

特点：大堆内存，长时间运行

收集器	可扩展性	长期稳定性	总体评分
Parallel GC	★★☆☆☆	★★★☆☆	不推荐
G1 GC	★★★★★	★★★★☆	强烈推荐

五、适用场景与调优参数

5.1 Parallel GC适用场景

最适合：

批处理系统
科学计算应用
后台数据处理
中小型堆内存（<4GB）
对吞吐量要求高，对延迟不敏感的应用

不适合：

交互式应用
实时交易系统
大堆内存应用
对延迟敏感的应用

5.2 G1 GC适用场景