本文已参与「新人创作礼」活动, 一起开启掘金创作之路。
前言
垃圾收集(Garbage Collection) ,简称为GC,诞生于1960年的Lisp语言,经过半个多世纪,目前已经十分成熟。JVM中,程序计数器、栈(虚拟机栈和本地方法栈) 都是随线程而生而生,随线程而灭而灭,栈帧随着方法的进入和退出做入栈和出栈操作,这些实现了自动的内存清理,因此,JVM中的垃圾回收主要集中于堆和方法区(JDK 8及之后是MetaSpace)中。
对象存活判断
判断对象是否存活一般有两种方式:
- 引用计数:每个对象有一个引用计数属性,新增一个引用时计数加
1,引用释放时计数减1,计数为0时就可以回收。此方法简单,无法解决对象相互循环引用的问题 - 可达性分析(
Reachability Analysis):从GC Roots开始向下搜索,搜索所走过的路径称为引用链。当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的,即不可达对象
在Java语言中,GC Roots包括:
- 虚拟机栈中引用的对象
- 本地方法栈中
JNI引用的对象 - 方法区中类静态属性引用的对象
- 方法区中常量引用的对象
GC算法
标记-清除算法
标记-清除(Mark-Sweep)算法,如它的名字一样,分为标记和清除两个阶段:
-
首先标记出所有需要回收的对象
-
在标记完成后统一回收掉所有被标记的对象
之所以说它是最基础的收集算法,是因为后续的收集算法都是基于这种思路并对其缺点进行改进而得到的。
标记-清除算法的主要缺点有两个:
-
一个是效率问题,标记和清除过程的效率都不高
-
另外一个是空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片太多的话,当下一次为对象分配内存的时候,就会发现没有足够的空间,从而再一次进行垃圾回收。
复制算法
复制(Copying)垃圾收集算法,它将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。
这样使得每次都是对其中的一块进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。只是这种算法的代价是将内存缩小为原来的一半,持续复制长期生存的对象会导致效率降低。
标记-压缩算法
复制收集算法在对象存活率较高时就要执行较多的复制操作,效率变低。如果不想浪费50%的空间,就需要有额外的空间进行分配担保,以应对被使用的内存中所有对象都100%存活的极端情况,所以在老年代一般不能直接选用这种算法。
根据老年代的特点,于是出现了另外一种标记-整理(Mark-Compact)算法。其标记过程仍然与标记-清除算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存,这样就避免了内存碎片。
## 分代收集算法
分代回收理论
感谢@穿不起AJ的阿鉴的指正,此处应修改为分代回收理论。
分代收集(Generational Collection)理论,把堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。
在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。
老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用标记-清理或标记-整理算法来进行回收。
这么看来,所谓的分代回收算法只是将标记-清理、复制和标记-清除算法进行了整合划分,并不是一种新的垃圾回收算法。