阅读 238

对序列化中反射的一点思考

前言

序列化大家都不陌生,说白了就是把当前类对象的状态保存为二进制,然后被用来持久化或者网络传输;常用的RPC框架在数据传输前都会进行序列化操作,主流的RPC框架包含了多种序列化方式比如protobuf,fastjson,kryo,hessian,java内置序列化等等,大致可以分为二进制和字符串(json字符串)。

反射

因为需要把当前类对象状态保存为二进制,所以往往需要获取所有类属性,这时候大部分的序列化方式都用到了反射,通过反射获取所有类属性获取方法,然后获取到属性值,大致如下:

//1.方法
Method[] methods = obj.getClass().getDeclaredMethods();
for(Method method : methods) {
	method.invoke(obj);
}
//2.字段
Field fields[] = obj.getClass().getDeclaredFields();
for (Field field : fields) {
	field.get(obj);
}
复制代码

但是反射往往在性能上被大家所怀疑,所以出现了类似protobuf采用自动生成序列化代码的方式,fastjson使用ASM代替反射的方式;下面我们先用简单的测试来对比一下各种方式的性能,看反射是否真的慢;

性能测试

在windows10+jdk8环境下分别对直接,反射,以及ASM调用方法分别进行压力测试,看起消耗的时间,测试中可以多次执行,取稳定的值;以下测试分别从Person对象通过方法获取属性值,如下:

public class Person {
	private String id;
	private String name;
    
	public String getId() {
		return id;
	}
	public String getName() {
		return name;
	}
}
复制代码

直接调用

直接调用也就是我们平时最常用的方式,直接通过对象调用方法名称获取属性值,我们在压测的时候会分别轮询两个方法:

public static void test() {
	Person person = new Person("10001", "zhaohui");
	long startTime = System.currentTimeMillis();
	for (int i = 0; i < 1_0000_0000; i++) {
		if (i % 2 == 0) {
			person.getId();
		} else {
			person.getName();
		}
	}
	long endTime = System.currentTimeMillis();
	System.out.println("Manual time:" + (endTime - startTime) + "ms");
	}
复制代码

多次测试结果大概在90ms左右,直接调用速度是最快的,但是需要我们手动的写每个bean的序列化代码,或者像protobuf一样使用工具给我们生成所有的序列化代码,比如生成Person的序列化代码:

 public void writeTo(com.google.protobuf.CodedOutputStream output)
                        throws java.io.IOException {
    getSerializedSize();
    if (((bitField0_ & 0x00000001) == 0x00000001)) {
      output.writeInt32(1, id_);
    }
    if (((bitField0_ & 0x00000002) == 0x00000002)) {
      output.writeBytes(2, getNameBytes());
    }
    getUnknownFields().writeTo(output);
 }
复制代码

可以看到每个生成的bean都自动生成了序列化代码,并且所有的bean都继承于统一的抽象类,这样提供一整套规范;有个缺点就是每次修改需要手动改proto文件,然后重新生成代码;

反射调用

使用jdk提供的反射机制,获取Methods,然后获取属性值,具体代码如下:

	public static void test() throws Exception {
		long startTime = System.currentTimeMillis();
		Person person = new Person("10001", "zhaohui");
		Method[] ms = Person.class.getDeclaredMethods();
		for (int i = 0; i < 1_0000_0000; i++) {
			ms[i & ms.length - 1].invoke(person);
		}
		long endTime = System.currentTimeMillis();
		System.out.println("Reflex time:" + (endTime - startTime) + "ms");
	}
复制代码

经测试时间大概维持在205ms左右,和直接调用还是存在一定差距的,不过jdk每一轮的升级,都在提升性能,比如jdk7中引入的MethodHandle,模拟字节码层面的调用;

ASM调用

反射是读取持久堆上存储的类信息,而ASM是直接处理.class字节码的,无需加载类,我们这里使用ReflectASM来进行测试;

ReflectASM 是一个非常小的 Java 类库,通过代码生成来提供高性能的反射处理,自动为 get/set 字段提供访问类,访问类使用字节码操作而不是 Java 的反射技术,因此非常快。

	public static void test() {
		Person person = new Person("10001", "zhaohui");
		long startTime = System.currentTimeMillis();

		MethodAccess methodAccess = MethodAccess.get(Person.class);
		String[] mns = methodAccess.getMethodNames();
		int len = mns.length;
		int indexs[] = new int[len];
		for (int i = 0; i < len; i++) {
			indexs[i] = methodAccess.getIndex(mns[i]);
		}
		for (int i = 0; i < 1_0000_0000; i++) {
			methodAccess.invoke(person, indexs[i & len - 1]);
		}

		long endTime = System.currentTimeMillis();
		System.out.println("ASM time:" + (endTime - startTime) + "ms");
	}
复制代码

经测试时间维持在110ms左右,速度还是很快的,快赶上直接调用了;其中为了获得最大性能,应使用方法或字段索引而不是名称;

总结

可以看到虽然反射性能一直在提升,但是相比直接调用和ASM的方式还是有一点差距;但其实如果用在RPC上这点时间在整个网络传输上来说可以说微乎其微;如果对性能极度追求,可以考虑使用直接调用或者ASM的方式;

思考

关于直接调用上面说到protobuf,通过工具生成序列化代码,但是这种方式每次改动都要手动生成代码,有点麻烦,是否可以直接利用lombok这种框架做一个扩展,自动生成序列化代码,其实lombok底层也用到ASM,直接生成字节码代码,提供序列化注解

@Target(ElementType.TYPE)
@Retention(RetentionPolicy.SOURCE)
public @interface Serialize {
}
复制代码

然后可以直接把注解应用到bean中,直接帮助我们生成序列化代码,就像@Getter/@Setter一样;相当于直接调用和ASM方式的一种整合;类似如下代码:

@Serialize
public class Person {
	private String id;
	private String name;
	
    //自动生成
	public byte[] serialize(){
		ByteBuffer bb = ByteBuffer.allocate(100);
		bb.put(id.getBytes());
		bb.put(name.getBytes());
		return bb.array();
	}
}
复制代码

感谢关注

可以关注微信公众号「回滚吧代码」,第一时间阅读,文章持续更新;专注Java源码、架构、算法和面试。

文章分类
后端
文章标签