在学习jvm中的垃圾回收算法之前我们应该要先确定以下的一些问题:
-
哪些内存需要回收?
-
什么时候回收?
-
如何回收?
现就第一个问题来谈论下,一般来说,Java内存运行时区域的各个部分,其中程序计数器、虚拟机栈、本地方法栈3个区域.每一个栈帧中分配多少内存基本上是在类结构确定下来时就已知的,这几个区域的内存分配和回收都具备确定性,在这几个区域内就不需要过多考虑回收的问题,
而Java堆和方法区则不一样,一个接口中的多个实现类需要的内存可能不一样,一个方法中的多个分支需要的内存也可能不一样,我们只有在程序处于运行期间时才能知道会创建哪些对象,这部分内存的分配和回收都是动态的,垃圾收集器所关注的是这部分内存
因此
(java堆还有方法区是垃圾回收器主要关注的内存)。
那么当我们已经确定好主要关注的时java堆以及方法区的数据需要进行回收,那么我们第二个需要关注的就是什么时候回收了,我们可以思考下,如果我们java堆中的对象以及方法区中的变量,类,等不再使用了,那么是不是可以回收了呢?所以专业来说,我们在回收对象时,需要确认对象是否已经不再使用,或者说对象已经"死亡"了。
关于确认对象是否已经"死亡"我们也有两种算法来进行判断。
1.引用计数算法(主流的虚拟机不用)
主要不能解决对象的循环引用问题。
很多教科书判断对象是否存活的算法是这样的:给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器值就减1;任何时刻计数器为0的对象就是不可能再被使用的。
实现简单,判定效率也很高,在大部分情况下它都是一个不错的算法。但是,至少主流的Java虚拟机里面没有选用引用计数算法来管理内存,其中最主要的原因是它很难解决对象之间相互循环引用的问题。
例如: 对象objA和objB都有字段instance,赋值令objA.instance=objB及objB.instance=objA,除此之外,这两个对象再无任何引用,实际上这两个对象已经不可能再被访问,但是它们因为互相引用着对方,导致它们的引用计数都不为0,于是引用计数算法无法通知GC收集器回收它们。在这种情况下,这两个对象永远不可能回收!!!
我们可以看一下下面的例子,来证明我标题说的,我们的虚拟机不是使用该算法判断。
/**
*testGC()方法执行后,objA和objB会不会被GC呢?
*@author zzm
*/
public class ReferenceCountingGC{
public Object instance=null;
private static final int_1MB=1024*1024;
/**
*这个成员属性的唯一意义就是占点内存,以便能在GC日志中看清楚是否被回收过*/
private byte[]bigSize=new byte[2*_1MB];
public static void testGC(){
ReferenceCountingGC objA=new ReferenceCountingGC();
ReferenceCountingGC objB=new ReferenceCountingGC();
objA.instance=objB;
objB.instance=objA;
objA=null;
objB=null;
//假设在这行发生GC,objA和objB是否能被回收?
System.gc();
运行结果:
//直接回收了,虚拟机并没有因为这两个对象互相引用就不回收它们,
//这也从侧面说明虚拟机并不是通过引用计数算法来判断对象是否存活的。
2.可达性分析算法(java、c#。。)
在主流的商用程序语言(Java、C#,甚至包括前面提到的古老的Lisp)的主流实现中,都是称通过可达性分析(Reachability Analysis)来判定对象是否存活的。
这个算法的基本思路就是通过一系列的称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连(用图论的话来说,就是从GC Roots到这个对象不可达)时,则证明此对象是不可用的。如图所示:
同时我们还需要知道,即使在使用可达性算法之后,不可用的对象,不代表必须要进行回收的。在真正宣告一个对象死亡,我们需要经过至少两次的历程:
1.如果对象在进行可达性分析后发现没有与GC Roots相连接的引用链,那它将会被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。当对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,虚拟机将这两种情况都视为“没有必要执行”.
如果这个对象被判定为有必要执行finalize()方法,那么这个对象将会放置在一个叫做F-Queue的队列之中,并在稍后由一个由虚拟机自动建立的、低优先级的Finalizer线程去执行它。这里所谓的“执行”是指虚拟机会触发这个方法,但并不承诺会等待它运行结束,这样做的原因是,如果一个对象在finalize()方法中执行缓慢,或者发生了死循环(更极端的情况),将很可能会导致F-Queue队列中其他对象永久处于等待,甚至导致整个内存回收系统崩溃。
- finalize()方法是对象逃脱死亡命运的最后一次机会,稍后GC将对F-Queue中的对象进行第二次小规模的标记,如果对象要在finalize()中成功拯救自己——只要重新与引用链上的任何一个对象建立关联即可,譬如把自己(this关键字)赋值给某个类变量或者对象的成员变量,那在第二次标记时它将被移除出“即将回收”的集合;如果对象这时候还没有逃脱,那基本上它就真的被回收了。
任何一个对象的finalize()方法都只会被系统自动调用一次,如果对象面临下一次回收,它的finalize()方法不会被再次执行,因此第二段代码的自救行动失败了。
s上面讲的都是关于回收java堆的
下面我们来讲下关于方法区中的回收,主要包括废弃的常量以及无用的类。
在Java虚拟机规范中确实说过可以不要求虚拟机在方法区实现垃圾收集,而且在方法区中进行垃圾收集的“性价比”一般比较低:在堆中,尤其是在新生代中,常规应用进行一次垃圾收集一般可以回收70%~95%的空间,而永久代的垃圾收集效率远低于此。
废弃的常量回收
永久代的垃圾收集主要回收两部分内容:废弃常量和无用的类。回收废弃常量与回收Java堆中的对象非常类似。以常量池中字面量的回收为例,假如一个字符串“abc”已经进入了常量池中,但是当前系统没有任何一个String对象是叫做“abc”的,换句话说,就是没有任何String对象引用常量池中的“abc”常量,也没有其他地方引用了这个字面量,如果这时发生内存回收,而且必要的话,这个“abc”常量就会被系统清理出常量池。常量池中的其他类(接口)、方法、字段的符号引用也与此类似。
无用的类回收
类需要同时满足下面3个条件才能算是“无用的类”:
-
该类所有的实例都已经被回收,也就是Java堆中不存在该类的任何实例。
-
加载该类的ClassLoader已经被回收。(blog.csdn.net/briblue/art…)
-
该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该 类的方法。
虚拟机可以对满足上述3个条件的无用类进行回收,这里说的仅仅是“可以”,而并不是和对象一样,不使用了就必然会回收。
是否对类进行回收,HotSpot虚拟机提供了-Xnoclassgc参数进行控制,还可以使用-verbose:class以及-XX:+TraceClassLoading、-XX:+TraceClassUnLoading查看类加载和卸载信息,其中-verbose:class和-XX:+TraceClassLoading可以在Product版的虚拟机中使用,-XX:+TraceClassUnLoading参数需要 FastDebug版的虚拟机支持。
来自《深入理解JVM虚拟机》JVM高级特性与最佳实现。