如何有效的避免OOM,温故Java中的引用

1,041 阅读5分钟

占小狼 转载请注明原创出处,谢谢!

背景

前段时间,看到群里在讨论Java中的各种引用,不禁的细想了下,发现自己对它们的了解仅仅停留在了表面,对它们的实现原理、回收机制,并不熟悉,心里发毛。

大雪过后的魔都,显得更冷了,但Java的大道,越挫越勇。

一个简单的HashMap,相当于一个简陋版的缓存,如果不断的往里面添加数据,JVM迟早会发生OOM,那么有何有效的避免这种OOM,今天一起温故Java中的各种引用。

四种引用

在Java层面,一共有四种引用:强引用、软引用、弱引用、虚引用,从名字也可以发现,这几种引用的生命周期由强到弱。

这里为什么要说在Java层面呢,因为除了这四种引用,还有其它两种。 只是这四种在代码中触手可及,而其它两个,几乎碰不到。

强引用

强引用(Strong Reference)是使用最普遍的引用,99%的代码可能都是强引用,很多人平时接触的也都是强引用相关的代码,比如下面这种:

Object o = new Object()

这种情况是普遍存在的,在写中间件框架代码时,可能才需要其它引用。

如果一个对象,和GC Root有强引用的关系,当内存不足发生GC时,宁可抛出OOM异常,终止程序,也不会回收这些对象。

相反,当一个对象,和GC Root没有强引用关系时,可能会被回收(因为可能还有其它引用),如果没有任何引用关系,GC之后,该对象就被回收了。

软引用

软引用(Soft Reference),主要用来描述一些不那么重要的对象,它具有一个特性,会保证尽可能长时间的驻留在JVM中,只在GC多次之后实在不足内存才会被回收,这种特别适合用来实现缓存。

Object reference = new MyObject();
System.out.println(reference);
Reference root = new SoftReference(reference);
reference = null; // MyObject对象只有软引用
System.gc();
System.out.println(root.get());

强制GC之后,SoftReference所引用的对象并没有被回收,那么软引用的对象到底在哪个时间点会被回收呢?感兴趣的同学可以脑洞一下。

弱引用

弱引用(Weak Reference),相对于软引用,它的生命周期更短,当发生GC时,如果扫描到一个对象只有弱引用,不管当前内存是否足够,都会对它进行回收。

感觉说的有点干,来段代码解解渴。

Object reference = new MyObject();
System.out.println(reference);
Reference root = new WeakReference(reference);
reference = null; // MyObject对象只有弱引用
System.gc(); 
System.out.println(root.get());

发生GC之后,root.get()返回了null,说明对象已经被回收。

在JDK的WeakHashMap中,很好的应用了弱引用,其中Entry继承了WeakReference,如果一个entry对象,一旦没有指向key的强引用,WeakHashMap在GC后会自动删除相关的entry。

虚引用

虚引用(Phantom Reference),和之前两种引用的最大不同是:它的get方法一直返回null。

很奇怪,一个返回null的引用有什么用?

虚引用的使用场景很窄,在JDK中,目前只知道在申请堆外内存时有它的身影。 申请堆外内存时,在JVM堆中会创建一个对应的Cleaner对象,这个Cleaner类继承了PhantomReference,当DirectByteBuffer对象被回收时,可以执行对应的Cleaner对象的clean方法,做一些后续工作,这里是释放之前申请的堆外内存。

由于虚引用的get方法无法拿到真实对象,所以当你不想让真实对象被访问时,可以选择使用虚引用,它唯一能做的是在对象被GC时,收到通知,并执行一些后续工作。

看到有些文章说虚引用可以清理已经执行finalize方法,但是还没被回收的对象,这简直就是误导人嘛,与finalize方法有关的引用是FinalReference,这个引用就是之前说的其它两种中的一个。

实现原理

上述引用中,除了强引用,其它几种都有对应的实现类,都继承了Reference,所有的精华也都在这个类中。

Reference有几个重要的参数,有些和GC密切相关: 1、referent: 就是所引用的对象,会被GC特别对待。 2、queue:RererenceQueue,看名字也知道它是一个Reference队列,用来保存Reference对象,当新建一个Reference时,可以选择性的传入第二个参数。 3、discovered:该对象被JVM使用,表示下一个要被处理的Reference对象(1.8的实现) 4、next:当Reference对象被放入RererenceQueue时,使用next变量形成链表结构。 5、pending:该对象会被JVM使用,当前被处理的Reference对象。

Reference中有一个重要的线程 Reference Handler,运行优先级极高,启动之后负责轮询pending变量是否有数据,如果pending被JVM设置了一个值,就把它拿出来放到queue中,这里有个例外,就是之前说的堆外内存申请时的Cleaner对象,只会执行它的clean方法,并不会放到queue中。

当Reference对象被放进queue之后,就可以使用一个线程,依次拿出来进行处理。

文字太干,还是需要上代码:

final ReferenceQueue queue = new ReferenceQueue();
new Thread(new Runnable() {
@Override
public void run() {
while (true) {
try {
Reference reference = queue.remove();
System.out.println(reference + "回收了");
} catch (InterruptedException e) {

}
}
}
}).start();

Object o = new Object();
Reference root = new WeakReference(o, queue);
System.out.println(root);
o = null;
System.gc();
System.in.read();

上述代码中,先初始化了一个ReferenceQueue,随后又初始化了一个线程,循环的从queue中捞数据,因为当一个软引用、弱引用或虚引用的对象被GC回收时,这个引用会被放到对应的ReferenceQueue中,这里会被拿出来进行打印,更多的是做一些清理工作。

执行上述代码的结果:

java.lang.ref.WeakReference@34374ed5
0.174: [Full GC (System) 0.175: [CMS: 0K->437K(12288K), 0.0146570 secs] 1231K->437K(19712K), [CMS Perm : 2692K->2690K(21248K)], 0.0147430 secs] [Times: user=0.02 sys=0.00, real=0.01 secs] 
java.lang.ref.WeakReference@34374ed5 回收了

通过这种方式,有兴趣的同学可以验证一下其它引用。

总结

类型 生命周期 用途
软引用 直到内存不足时 缓存
弱引用 下次GC 缓存(WeakHashMap)
虚引用 下次GC 堆外内存管理