编译时注解解析及访问者模式的使用

717 阅读6分钟

访问者模式概述

访问者模式是一种将数据操作与数据结构分离的设计模式,它的使用频率不高,但是在aop的开发中,经常会遇到。

image.png

设计思想:

软件系统中拥有一个由许多对象构成的、比较稳定的对象结构,这些对象的类都拥有一个accept方法用来接收访问者对象的访问。访问者是一个接口,它拥有一个visit方法,这个方法对访问到的对象结构中不同类型的元素做出不同的处理。在对象的一次访问中,我们遍历整个对象结构,对每一个元素都实施accept方法,在每个元素的accept方法中会调用访问者的visit方法,从而访问者得以处理对象结构的每一个元素,我们可以针对对象结构设计不同的访问者来完成不同的操作,达到区别对待的效果。

使用场景:

  • 对象结构比较稳定,但经常需要在此对象结构上定义新的操作。
  • 需要对一个对象结构中的对象进行很多不同的并且不相关的操作,而需要避免这些操作‘污染’这些对象的类,也不希望在增加新操作时修改这些类。

编译时注解

在Android开发中,注解使用越来越频繁,按照处理时期,可以分为运行时注解和编译时注解。运行时注解由于性能问题被诟病(使用反射导致性能问题),编译时注解的核心原理依赖APT(Annotation Processing Tools)实现,Dagger、ARouter、ButterKnife等都是基于此。编译器注解是如何使用访问者模式的呢?

编译时注解的原理:

在某些代码元素(类型、函数、字段)添加注解,在编译时,编译器会检查AbstractProcessor的子类,并且调用该类型的process方法,然后将添加了注解的所有元素都传递到process方法中,这样开发人员可以在编译期进行相应的处理,比如:可以根据注解生成新的java类或者直接对代码元素进行加工处理。

在编译期处理的时候,是分开进行的。如果在某个处理中产生了新的java源文件,那么就需要另外一个处理来处理新生成的源文件,如此循环,知道没有新文件被生成为止。处理完成之后,再对java代码进行编译。

image.png

如图所示:将java源文件编译成class文件,大体要分为三步:

  1. 将全部的源码解析成语法树,输入到编译器的符号表中
  2. 注解处理器处理注解的过程
  3. 分析语法树并生成字节码
  • Parse and Enter: 词法分析:经过Scanner将源码的字符流解析成Token流

语法分析:根据token流,利用treemaker,以JCTree的子类作为语法节点来构建抽象语法树(AST)。

将java类中的符号输入到符号表中:符号表是由一组符号和符号信息构成的表格,在语法分析中,符号表所登记的内容将用于语义检查和产生中间代码。在目标代码生成阶段,符号表是对符号名进行地址分配的依据。

AST(Abstract Syntax Tree):是一种用来描述程序代码语法结构的树形表示方式,语法树的每个节点,都表明程序代码中的一个语法结构,如包、类型、修饰符、运算符、接口、返回值均可以是一个语法结构。

  • Annotation Processing java提供了一组插入式注解处理器的标准API在编译期间对注解进行处理;在注解处理期间可以获取到全部的抽象语法树,能够对抽象语法树进行修改,语法树被修改以后,编译器将回到解析以及填充符号表的过程从新处理,直到全部插入式注解处理器都没有再对语法树进行修改为止。

  • Analyse And Generte 语义分析:主要任务是对结构正确的源程序进行上下文有关性质的审核。

解语法糖:还原简单的基础语法结构

生成字节码:将前面各个步骤所生成的信息(语法树、符号表)转化为字节码,输出到class文件中。

Mirror API和Element代码元素

APT是一个命令行工具,与之配套的还有一套用来描述程序语义结构的Mirror API,Mirror API(com.sun.mirror.*) 描述的是程序在编译时的静态结构,通过Mirror API可以获取到被注解的Java类型元素的信息,从而提供相应的处理逻辑,具体的处理工作交给APT工具来完成。

对于编译器来说,代码中的元素结构是基本不变的,例如,组成代码的基本元素有包、类、函数、字段、类型参数、变量等,JDK中为这些元素定义了一个基类,Element类,它有以下几个子类

  • PackageElement:包元素,包含了某个包下的信息,可以获取到包名等
  • TypeElement:类型元素,如某个字段属于某种类型
  • ExecutableElement:可执行元素,代表了函数类型的元素
  • VariableElement:变量元素
  • TypeParameterElement:类型参数元素

image.png

public interface Element extends AnnotatedConstruct {
    //获取元素类型
    ElementKind getKind();
    //获取修饰符(public、static、final等)
    Set<Modifier> getModifiers();
    
    ...
    //接收访问者的访问
    <R, P> R accept(ElementVisitor<R, P> visitor, P p);
}

Element定义了一个代码元素的通用接口,关注一下accept()函数,接收一个ElementVisitor和类型为P的参数,ElementVisitor就是访问者类型,P则用于传递一些额外的参数给Visitor。

看一下ElementVisitor:

public interface ElementVisitor<R, P> {
    //访问元素
    R visit(Element var1, P var2);
    //访问包元素
    R visitPackage(PackageElement var1, P var2);
    //访问类型元素
    R visitType(TypeElement var1, P var2);
    //访问变量元素
    R visitVariable(VariableElement var1, P var2);
    //访问可执行元素
    R visitExecutable(ExecutableElement var1, P var2);
    //访问参数元素
    R visitTypeParameter(TypeParameterElement var1, P var2);
    //处理未知元素类型
    R visitUnknown(Element var1, P var2);

ElementVisitor中定义了多个visit接口函数,每个函数处理一种元素类型,这就是典型的访问者模式。

一个类元素和函数元素是完全不一样的,他们的结构不一样,因此,编译器对他们的操作肯定是不一样的,通过访问者模式正好可以解决数据结构与数据操作分离的问题,避免某些操作‘污染’数据对象类。

当Visitor对元素结构进行访问时,就可以针对不同的类型进行不同的处理

结语

编译器将代码抽象成一个代码元素树,然后在编译时对整棵树进行遍历访问,每个元素都有一个accept方法接收访问者的访问,每个访问者中有对应的visit函数,在每个visit方法中对不同的类型进行不同的处理,这样就达到了差异处理的效果,同时将数据结构和数据操作分离,使得每个类型的职责更加单一。