1-阿里面试题:JVM中的类加载问题

65 阅读9分钟

1.类加载机制你怎么理解?

加载.class文件的方式

  • 从本地系统中直接加载

典型场景:这个我就不废话了

  • 通过网络下载.class文件

典型场景:web Applet,也就是我们的小程序应用

  • 从zip,jar等归档文件中加载.class文件

典型场景:后续演变为jar、war格式

  • 从专有数据库中提取.class文件

典型场景:JSP应用从专有数据库中提取.c1ass文件,较为少见

  • 将Java源文件动态编译为.class文件,也就是运行时计算而成

典型场景:动态代理技术

  • 从加密文件中获取,

典型场景:典型的防c1ass文件被反编译的保护措施

好,聊完了这个问题之后,问题接踵而至,我们的类加载的方式已经了解了,那么加载的流程到底是怎 样的呢?

image.png

所谓类加载机制就是

虚拟机把class文件加载到内存 并对数据进行校验,转换解析和初始化 形成可以虚拟机直接使用的Java类型,即java.lang.class

2.2.1 装载(Load)

查找和导入class文件

(1)通过一个类的全限定名获取定义此类的二进制字节流(由上可知,我们不一定从字节码文件中获得,还有上述很多种方式) 思考:那么这个时候我们是不是需要一个工具,寻找器,来寻找获取我们的二进制字节流。而我们的java中恰好有这么一段代码模块。可以实现通过类全名来获取此类的二进制字节流这个动作,并且将这个动作放到放到java虚拟机外部去实现,以便让应用程序决定如何获取所需要的类,实现这个动作的代码模块成为“类加载器” (2)将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构 (3)在Java堆中生成一个代表这个类的java.lang.class对象,作为对方法区中这些数据的访问入口 获取类的二进制字节流的阶段是我们IAV程序员最关注的阶段,也是操控性最强的一个阶段。因为这个阶段我 们可以对于我们的类加载器进行操作,比如我们想自定义类加载器进行操作用以完成加载,又或者我们想通过 AV Agent来完成我们的字节码增强操作。 在我们的装载阶段完成之后,这个时候在我们的内存当中,我们的运行时数据区的方法区以及堆就已经有数据了

  • 方法区:类信息,静恋变量,常量
  • 堆:代表被加载类的java.lang.Class对象

即时编译之后的热点代码并不在这个阶段进入方法区

2.2.2 链接(Link)

2.2.2.1 验证(Verify)

验证只要是为了确保Class文件中的字节流包含的信意先全符咨当前是拟机的要求,并且还要求我们的信息不会危害虚拟机自身的安全,导致虚拟机的崩溃。

  • 文件格式验证

验证字节流是否符合Class文件格式的规范,并且能被当前版本的虚拟机处理,该验证的主要目的是保证输入的字节流能正确地解析并存储于方法区之内。这阶段的验证是基于二进制字节流进行的,只有经过该阶段的验证后,字节流才会进入内存的方法区中进行存储,后面验证都是基于方法区的存储结构进行的。

举例: 1.是否以16进制cafebaby开头 2.版本号是否正确

  • 元数据验证

对类的元数据信息进行语义校验(其实就是对Java语法校验),保证不存在不符合Java语法规范的元数据信息。

举例:

1.是否有父类

2.是否继承了final类

因为我们的fifinal类是不能被继承的,继承了就会出现问题。

3.一个非抽象类是否实现了所有的抽象方法

如果没有实现,那么这个类也是无效的。 总结:对类的元数据信息进行语义校验(其实就是对Java语法校验),保证不存在不符合Java语法规范的元数据信息。

  • 字节码验证

进行数据流和控制流分析,确定程序语义是合法的、符合逻辑的。对类的方法体进行校验分析,保证被校验的类的方法在运行时不会做出危害虚拟机安全的行为。获取类的二进制字节流的阶段是我们JAVA程序员最关注的阶段,也是操控性最强的一个阶段,因为这个阶段我们可以对于我们的类加载器进行操作,比如我们想自定义类加载器进行操作用以完成加载,又或者我们想通过JAVA Agent来完成我们的字节码增强操作。

举例: 字节码的验证会相对来说较为复杂。 1.运行检查 2.栈数据类型和操作码操作参数吻合(比如栈空间只有4个字节,但是我们实际需要的远远大于4个字节,那么这个时候这个字节码就是有问题的) 3.跳转指令指向合理的位置

  • 符号引用验证

这是最后一个阶段的验证,它发生在虚拟机将符号引用转化为直接引用的时候(解析阶段),可以看作是对类自身以外的信息(常量池中的各种符号引用)进行匹配性的校验。符号引用验证的目的是确保解析动作能正常执行。

举例: 1.常量池中描述类是否存在

2.访问的方法或者字段是否存在且具有足够的权限

注意:但是,我们很多情况下可能认为我们的代码肯定是没问题的,验证的过程完全没必要,那么其实我们可 以添加参数

-Xverify:none 取消验证。

2.2.2.2 准备(Prepare)

为类的静态变量分配内存,并将其初始化为默认值

private final static inta =1;a=0;

image.png

  • 这里不包含用final修饰的static,因为final在编译的时候就会分配了,准备阶段会显式初始化;
  • 这里不会为实例变量(也就是没加static)分配初始化,类变量会分配在方法区中,而实例变量是会随着对象一起分配到Java堆中。
public class Demo1{
    private static int i;
    
    public static void main(string[] args){
        //正常打印出0,因为静态变量i在准备阶股会有默认值0                    System.out.println(i);
    }
}
public class Demo2{
    public static void main(string[] args){
        // 编译通不过,因为局品变量没有赋值不能被使用
        int i;
        System.out.println(i);
    }
}        

进行分配内存的只是包括类变量(静态变量),而不包括实例变量,实例变量是在对象实例化时随着对象一起分配在java堆中的。通常情况下,初始值为零值,假设public static int a=1;那么a在准备阶段过后的初始值为0,不为1,这时候只是开辟了内存空间,并没有运行java代码,a赋值为1的指令是程序被编译后,存放于类构造器(0)方法之中,所以a被赋值为1是在初始化阶段才会执行。

2.2.2.3 解析(Resolve)

把类中的符号引用转换为直接引用 符号引用就是一组符号来描述目标,可以是任何字面量。 直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄。

解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。解析动作主要针对类或扒口、字段、类方法、接口方法、方法类型、方法句柄和调用限定符7类符号引用进行。

直接引用是与虚拟机内存布局实现相关,同一个符号引用在不同虚拟机实例上翻译出来的直接引用一般

不会相同,如果有了直接引用,那引用的目标必定存在内存中。

对解析结果进行缓存

同一符号引用进行多次解析请求是很常见的,除invokedvnamic指令以外,虚拟机实现可以对第一次解析结果进行缓存,来避免解析动作重复进行。无论是否真正执行了多次解析动作,虚拟机需要保证的是在同一个实体中,如果一个引用符号之前已经被成功解析过,那么后续的引用解析请求就应当一直成功;同样的,如果 第一次解析失败,那么其他指令对这个符号的解析请求也应该收到相同的异常。

inDy(invokedynamic)是java7引入的一条新的虚拟机指令,这是自 1.0 以来第一次引入新的虚拟机指令。到了 java8 这条指令才第一次在 java 应用,用在 lambda 表达式中。 indy 与其他 invoke 指令不同的是它允许由应用级的代码来决定方法解析。这里不演示

2.2.3 初始化(Initialize)

初始化阶段是执行类构造器()方法的过程。

或者讲得通俗易懂些

在准备阶段,类变量已赋过一次系统要求的初始值,而在初始化阶段,则是根据程序员通过程序制定的主观计划去初始化类变量和其他资源,比如赋值。

在Java中对类变量进行初始值设定有两种方式:

  • 声明类变量是指定初始值unlun991
  • 使用静态代码块为类变量指定初始值

按照程序员的逻辑,你必须把静态变量定义在静态代码块的前面。因为两个的执行是会根据代码编写的顺序来决定的,顺序搞错了可能会影响你的业务代码。

JVM初始化步骤:

  • 假如这个类还没有被加载和连接,则程序先加载并链接该类
  • 假如该类的直接父类还没有被初始化,则先初始化其直接父类
  • 假如类中有初始化语句,则系统依次执行这些初始化语句