干货,记一次Metaspace导致频繁fgc的问题排查过程

778 阅读3分钟

最近线上有一条机器在运行了10几天后出现告警,频繁出现fgc,在切断流量之后,从运维那边拿了应用的heapdump文件。在一开始出现fgc时,我就上了容器平台查看了gc日志,gc日志如下:

从日志中可以看出很明显优于metaspace空间不够造成的fgc,而且不断进行fgc,且metaspace空间回收不了。于是查看一下jvm启动参数,参数如下:

这里Metaspace和MaxMetaspace都设置成了256M,奇怪了gc日志中Metaspace才使用了165M就出现了fgc,难道是新加载的类90M的空间吗,这个可以肯定不是,如果不是新申请90M的空间这个原因引起的,那么就只有metaspace内存碎片引起的了。于是通过mat分析heapdump,发现 DelegatingClassLoader有1100多个,于是先查看一下 DelegatingClassLoader是个什么东西?其属于sun.reflect包下,代码如下:

证明其确实一个ClassLoader。

那到底是什么对象在引用这些ClassLoader呢,通过mat发现是 GeneratedMethodAccessor在引用这些ClassLoader,继续跟踪发现是mybatis的Reflector应用了这些对象。好办了,于是继续查看了Reflector的代码,代码片段如下:

这个Reflector对象会缓存orm中实体类的getter setter方法,mybatis需要将表中的记录转换成java实体类,为了提高反射的效率将实体类的方法、构造函数等缓存起来了,Mybatis会在运行的过程中通过 ReflectorFactory为每一个实体类创建一个 Reflector方便后续进行反射调用。

问题来了,为什么会有这么多的 DelegatingClassLoader呢?通过mat可以分析出来,这些ClassLoader最终都是被java的 Method对象所引用的。

于是分析Method的创建过程和Method的调用过程,最终发现Method在调用过程会创建一个MethodAccessor并将MehtodAccessor作为存在一个叫做methodAccessor的field中,java为了提高反射调用的性能,用了一种膨胀(inflation)的方式(从jni调用转换成classbytes调用),通过参数-Dsun.reflect.inflationThreshold进行控制默认15,在小于这个次数时会使用native的方式对方法进行调用,如果method的调用次数超过指定次数就会使用字节码的方式生成方法调用,如果使用字节码的方式最终会为每一个方法都生成 DelegatingClassLoader。具体的源码如下:Method.invoke方法:

Method.acquireMethodAccessor方法:

ReflectionFactory.newMethodAccessor方法:

NativeMethodAccessorImpl.invoke方法:

MethodAccessorGenerator.generateMethod方法片段:

ClassDefiner.defineClass方法:

另外还有RefectionFactory的checkInitted方法会通过 System.getProperty方法拿 sun.reflect.inflationThresholdproperty,默认值为15。代码的流程不是很长,切比较容易理解。接下来就是验证是不是java反射的Inflat方式引起的。于是写了下面的例子进行验证:

通过不设置参数 sun.reflect.inflationThreshold和设置参数为0,运行结果如下:不设置的情况:

设置为0的情况:

可以看出两种设置下Metaspace内存占用相差很大,基本验证分析的结果是正确的。最终针对这次因为Metaspace引起频繁fgc的修复的方案可以有:

增大Metaspace空间

牺牲一些性能,应用启动参数中添加参数 -Dsun.reflect.inflationThreshold,并将其值设置的足够大。