JVM 面试高频考点:由浅入深带你了解 G1 垃圾回收器!

2,060 阅读5分钟

​​​​​​​​摘要: G1 垃圾回收器是一款主要面向服务端应用的垃圾收集器。

本文分享自华为云社区《JVM面试高频考点:由浅入深带你了解G1垃圾回收器!!!》,原文作者:Code 皮皮虾 。

G1 垃圾回收器介绍

G1 垃圾回收器是一款主要面向服务端应用的垃圾收集器。作为垃圾回收器技术发展史上里程碑的成果,G1 垃圾回收器不同于以往的垃圾回收器,首先是思想上的转变,如下图:

G1 对于 Java 堆的划分

上面的图,小伙伴们第一次看可能不咋明白,因为各位还不了解 G1,看看下面的话,应该就差不多了。

G1 垃圾回收器对于 Java 堆区域的划分不同于以往我们对 Java 对区域划分的认知

以往对于 Java 堆区域的划分为:新生代和老年代,新生代又划分为 Eden 区和 Survivor 区,Survivor 区又分为 from 区和 to 区。

但是现在,G1 不再坚持固定大小以及固定数量的分代区域划分,而是把连续的 Java 堆空间划分为多个大小相等的独立区域(Region),每个 Region 都可以成为 Eden 空间、Survivor 空间、老年代空间。

这种思想上的转变和设计,使得 G1 可以面向堆内存任何部分来组成回收集来进行回收,衡量标准不再是它属于哪个分代,而是哪块内存存放的垃圾最多,回收收益最大,这就是 G1 收集器的 Mixed GC 模式,即混合 GC 模式。

Region 还有一类特殊的 Humongous 区域,专门用来存储大对象。G1 认为只要大小超过了一个 Region 容量一半的对象即可判定为大对象。如果是那些超过了整个 Region 容量的超大对象,将会放在连续 N 个 Humongous Region 区域。

Region 的取值范围为 1M ~ 32M

Region 的默认个数为 2048 个

-XX:G1HeapRegionSize = N

G1 这么做看起来是由一种焕然一新的感觉,但细心的小伙伴可能已经发现,如果 Region 之间存在跨区引用对象,那这些对象如何解决?

1. 不管是 G1 还是其他分代收集器,JVM 都是使用记忆集(Remembered Set) 来避免全局扫描。

2. 每个 Region 都有一个对应的记忆集。

3. 每次 Reference 类型数据写操作时,都会产生一个 写屏障(Write Barrier)暂时去终止操作

4. 然后检查将要写入的引用 指向的对象是否和该 Reference 类型数据在不同的 Region(其他收集器:检查老年代对象是否引用了新生代对象)

5. 如果不同,通过 卡表(Card Table)把相关引用信息记录到引用指向对象的所在 Region 对应的记忆集(Remembered Set) 中

6. 当进行垃圾收集时,在 GC Roots 枚举范围加上记忆集;就可以保证不进行全局扫描了。

G1 的记忆集可以理解为一个哈希表,Key 就是别的 Region 的起始地址,Value 就是卡表的索引号集合。

因为 G1 将 Java 堆划分为一个个 Region 的缘故,而 Region 数量相比于传统分代数量明显多得多,所以 G1 相比于传统的垃圾回收器来说,需要消耗相当于 Java 堆容量 10%~ 20%的额外空间来维持收集器的工作。

G1 垃圾回收器工作流程

  • 初始标记(Initial Marking):这阶段仅仅只是标记 GC Roots 能直接关联到的对象并修改 TAMS(Next Top at MarkStart)的值,让下一阶段用户程序并发运行时,能在正确的可用的 Region 中创建新对象,这阶段需要停顿线程,但是耗时很短。而且是借用进行 Minor GC 的时候同步完成的,所以 G1 收集器在这个阶段实际并没有额外的停顿。

  • 并发标记(ConcurrentMarking):从 GC Roots 开始对堆的对象进行可达性分析,递归扫描整个堆里的对象图,找出存活的对象,这阶段耗时较长,但是可以与用户程序并发执行。当对象图扫描完成以后,还要重新处理 SATB 记录下的在并发时有引用变动的对象。

  • 最终标记(Final Marking):对用户线程做另一个短暂的暂停,用于处理并发阶段结束后仍遗留下来的最后那少量的 SATB 记录。

  • 筛选回收(Live Data Countingand Evacuation):负责更新 Region 的统计数据,对各个 Region 的回收价值和成本进行排序,根据用户所期望的停顿时间来制定回收计划。可以自由选择多个 Region 来构成会收集,然后把回收的那一部分 Region 中的存活对象==复制==到空的 Region 中,在对那些 Region 进行清空。

除了并发标记外,其余过程都要 STW

G1 和 CMS 的区别

  • G1 从整体上来看是 标记-整理 算法,但从局部(两个 Region 之间)是复制算法。而 CMS 是 标记-清除算法 所以说,G1 不会产生内存碎片,而 CMS 会产生内存碎片

  • CMS 使用了 写后屏障来维护卡表,而 G1 不仅使用了写后屏障来维护卡表,还是用了写前屏障来跟踪并发时的指针变化情况(为了实现原始快照)。

  • CMS 对 Java 堆内存使用的是传统的 新生代和老年代划分方法,而 G1 使用的全新的划分方法。

  • CMS 收集器只收集老年代,可以配合新生代的 Serial 和 ParNew 收集器一起使用。G1 收集器收集范围是老年代和新生代。不需要结合其他收集器使用

  • CMS 使用 增量更新解决并发标记下出现的错误标记问题,而 G1 使用原始快照解决

点击关注,第一时间了解华为云新鲜技术~