持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第14天,点击查看活动详情
3.2 垃圾回收
3.2.1 垃圾判断算法
引用计数算法(Refesrence Counting)
当对象添加一个引用计数器,当有一个地方以用它,计数器加1,当引用失效,计数器减一,任何时刻计数器为0的对象j就是不可能再被使用。弊端:引用计数器可能无法解决循环引用的问题
根搜索算法( Root Tracing)
在实际生产语言中(java,C#等)都使用根搜索算法判断对象是否存活。算法的基本思路就是通过一系列被称作“GC ROOTS “ 的点作为起始进行向下搜索,当一个对象到GC ROOTS 没有任何引用链相连,则证明此对象是不可用的。
其中的GC ROOTS 包括:
- 在VM栈中(帧中的本地变量)中的引用
- 方法区中的静态引用
- JNI(即一般所说的Native方法)中的引用
3.2.2 垃圾回收期的选择和实现
引用类型
GC要做的是将那些dead对象所占的内存回收掉,hotsopt认为没有引用的对象就是dead。hotspot将引用分成四种,strong,soft,weak,phantom。strong引用是我们最常用到的引用,即默认通过Object o = new Object() 这种方式进行的引用;soft,weak,Phantom这三种都是继承reference
在 Full GC时会对 Reference类型的引用进行特殊处理 Soft:内存不够时一定会被GC,长期不用也会被GC Weak:一定会被GC Phantom:本来就没引用,当从 jvm 堆中释放时会通知
GC的时机
在分代模型的基础上,GC从时机上分为两种: Scavenge GC和Full GC
- Scavenge GC (Minor GC):对新生代,触发时机是在新对象生成时,Eden空间满了,理论上Eden区大多数对象会在 Scavenge GC回收,复制算法的执行效率会很高, Scavenge GC时间比较短。
- Full GC:对整个JVM进行整理,包括 Young、Old和Perm(永久代,jdk8没有,jdk为元空间),主要的触发时机:1)Old满了2)Perm满了3) system.gc() Full GC的执行效率很低,尽量减少 Full GC
3.2.3 GC时机-线程角度
安全点
枚举根节点:当执行系统停顿下来后,并不需要一个不漏地检查完所有执行上下文和全局的引用位置,虚拟机应当是有办法直接得知哪些地方存放着对象引用。在 HotSpot的实现中,是使用一组称为 OopMap的数据结构来达到这个目的的
安全点在 OopMap的协助下, Hotspot可以快速且准确地完成GC Roots枚举,但一个很现实的问题随之而来:很多指令可能导致引用关系变化,或者说引起 OopMap内容变化的指令非常多,如果为每一条指令都生成对应的 OopMap,那将会要大量的额外空间,这样GC的空间成本将会变得更高实际上, Hotspot并没有为每条指令都生成 OopMap,只是在“特定的位置”记录了这些信息,这些位置称为安全点( Safepoint),即程序执行时并非在所有地方都能停顿下来开始GC,只有在达到安全点时才能暂停。
Safepoint的选定既不能太少以至于让GC等待时间太长,也不能过于频繁以至于过分增大运行时的负载。所以,安全点的选定基本上是以“是否具有让程序长时间执行的特征”为标准进行选定的,因为每条指令执行的时间非常短暂,程序不太可能因为指令流长度太长这个原因而过长时间运行,“长时间执行”的最明显特征就是指令序列复用,例如方法调用、循环跳转、异常跳转等,所以具有这些功能的指令オ会产生 Safepoint(不是很懂)
对于 Safepoint,另一个需要考虑的问题是如何在GC发生时让所有线程(这里不包括执行JNI调用的线程)都“跑”到最近的安全点再停顿下来:抢占式中断( Preemptive Suspension)和主动式中断(Voluntary Suspension)
抢占式中断
抢占式中断:它不需要线程的执行代码主动去配合,在GC发生时,首先把所有线程全部中断,如果有线程中断的地方不在安全点上,就恢复线程,让它“跑”到安全点上。
主动式中断
主动式中断:当GC需要中断线程的时候,不直接对线程操作,仅仅简单地设置一个标志,各个线程执行时主动去轮询这个标志,发现中断标志为真时就自己中断挂起。注意:这个轮询也只是在轮询也只是在指定的地方才进行轮询,标志的地方和安全点是重合的。现在几乎没有虚拟机采用抢占式中断来暂停线程从而响应GC事件。
安全区域
在使用 SafePoint似乎已经完美地解决了如何进入GC的问题,但实际上情况却并不一定。 SafePoint机制保证了程序执行时,在不太长的时间内就会遇到可进入GC的Safepoint。但如果程序在“不执行”的时候呢?所谓程序不执行就是没有分配CPU时间,典型的例子就是处于Sleep状态或者 Blocked状态,这时候线程无法响应JVM的中断请求,JVM也显然不太可能等待线程重新分配CPU时间。对于这种情况,就需要安全区域(SafeRegion)来解决了。
在线程执行到 Safe Region中的代码时,首先标识自己已经进入了 Safe Region,那样,当在这段时间里JVM要发起GC时,就不用管标识自己为 Safe Region状态的线程了。在线程要离开 Safe Region时,它要检査系统是否已经完成了根节点枚举(或者是整个GC过程),如果完成了,那线程就继续执行,否则它就必须等待直到收到可以安全离开 Safe Region的信号为止。