虚拟机类加载机制

1,068 阅读9分钟

类的生命周期

加载 -> 验证 -> 准备 -> 解析 -> 初始化 -> 使用 -> 卸载

  • 验证、准备、解析统称为连接
  • 加载、验证、准备、初始化和卸载这五个阶段的顺序是确定的,类型的加载过程必须按照这种顺序按部就班的开始(通常这些阶段都是交叉融合混合进行,会在一个阶段执行的过程中调用、激活另一阶段,开始时间顺序是固定的。例如,验证阶段中的文件格式验证)。
  • 解析阶段某些情况下可以在初始化后开始(?,目的是为了支持动态绑定)。

类加载过程

加载

加载是整个类加载过程中的一个阶段。 加载阶段,虚拟机主要负责:

  • 通过一个类的全限定名来获取定义此类的二进制字节流
  • 将这个字节流所代表的静态存储结构转换为方法区的运行时数据结构(类模型)
  • 在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口

一般通过内置的引导类加载器或者自定义的类加载器完成加载过程。非数组类型由类加载器进行加载,数组类型由虚拟机直接生成、继承于java.lang.Object,但是数组类型中元素类型由类加载器加载。加载结束后,类型数据安置在方法区之后,会在Java堆内存中实例化一个java.lang.Class类的对象,这个对象讲作为程序访问方法区中的类型数据的外部接口

类模型和Class实例

  1. 类模型存储在方法区
  2. class文件加载到元空间后,会在堆中创建一个Class对象,用来封装类位于方法区内的数据结构。每一个类都对应一个Class对象,Class类的构造方法是私有的,只有jvm可以创建。

image.png

验证

文件格式验证、元数据验证、字节码验证和符号引用验证

  • 文件格式验证保证输入的字节流能正确的解析并存储于方法区内,基于是二进制字节流进行,后三个验证都是基于方法区的存储结构进行
  • 元数据验证对类的元数据信息进行语义校验,保证符合Java语言规范的元数据信息
  • 字节码验通过数据流分析和控制流分析确定程序语义是合法、符合逻辑的,针对类的方法体进行校验分析
  • 符号引用验证,对类自身以外的各类信息进行匹配性校验,验证该类是否缺少或者被禁止访问它依赖的某些外部类、方法、字段等资源,在解析阶段发生,确保解析行为能正常进行

准备

正式为类中定义的变量(即静态变量,被static修饰的变量)分配内存并设定类变量初始值,Java8后,类变量会随着Class对象一起存放在Java堆中。另外还有两点需要注意,

  • 该阶段仅对类变量分配内存,不包括实例变量
  • 初始值,通常情况下表示的是数据类型的零值
例如,类变量定义为 public static int value = 123;
那value变量在准备阶段过后的初始值为 0,而不是 123,赋值 123 的动作要到初始化阶段才被执行。
那在特殊情况下,如果类变量定义为 public static final int value = 123;
那么这时候在准备阶段就会被初始化为 123

解析

将常量池中的符号引用替换为直接引用的过程

  • 符号引用:以一组符号来描述所引用的目标,与虚拟机实现的内存布局无关,引用的目标并不一定是已经加载到虚拟机内存当中的内容。符号引用的字面量形式已经按Class文件形式明确规定。
  • 直接引用:可以直接指向目标的指针、相对偏移量或者一个能间接定位到目标的句柄。与虚拟机实现的内存相关,如果有了直接引用,那么引用的目标必定已经在虚拟机的内存存在了

解析动作对象包括:

  • 类或接口
  • 字段
  • 类方法
  • 接口方法
  • 方法类型
  • 方法句柄
  • 调用点限定符

初始化

初始化类变量和其他资源

从编写到运行的各种形态

以HotSpot虚拟机为例,梳理一下从编写Java代码到虚拟机中,各个阶段的物质形态以及虚拟机内存分配等,也是为了更好的串联起来进一步理解。

  1. 编写Java代码
  2. 通过Javac编译到Class文件(具有严格的格式定义,好比查字典**)**
    • Class文件是一种二进制字节码文件, 其中包含了Java虚拟机指令集、符号表以及若干其他辅助信息
    • 一组以8个字节基础单位的二进制流,如果遇到需要占用8个字节以上空间的数据项时,采用高位在前的方式分割成若干个8个字节进行存储
    • 数据类型:无符号数 + 表 (只仅此两种)
      • 无符号数:基本数据类型,u1、u2、u4、u8分别表示1个字节、2个字节、4个字节、8个字节,可代表数字、索引引用、数量值以及UTF8编码构成的字符串值。
      • 表:由多个无符号数或者其他表作为数据项构成的符合数据类型,个人理解为就是用来在严格的Class文件格式下做对照关系的。
    • Class文件中不会保存各个方法、字段最终在内存中的布局信息。当虚拟机在做类加载时,将会从常量池中获得对应的符号引用。再在类创建时或者运行时解析、翻译到具体的内存地址之中。
  3. 虚拟机类加载
    • 加载
      • 虚拟机外部二进制字节流 -> 虚拟机设定的方法区数据存储格式(虚拟机自定义)(类模型
      • 方法区(元空间)产生类模型,表示类的数据结构;堆内存产生一个代表这个类的Class对象,作为方法区这个类的数据访问入口
    • 验证
      • 验证格式等,无形态变化
    • 准备
      • 静态成员变量随着Class对象在堆内存中分配内存并赋零值
    • 解析
      • 方法区常量池中存在字面量和符号引用,解析就是将符号引用替换为直接引用,将符号变为指针指向目标
      • 例子
    • 初始化
      • 动态成员变量分配内存并赋值

类加载之后,常量池的内容会进入运行时常量池,这时候里面的数据也许还保持着符号引用。 (因为解析的时机由JVM自己设定)
如果在虚拟机栈的栈帧中,我准备调用 main() 函数,那么会通过栈帧中持有的动态连接,找到运行时常量池, 然后找到main函数的常量 比如 #2 ,如果这个常量没有被解析过,那么就通过这个常量进行解析过程, 其中包括,通过常量找到 类名 和 nameAndType,通过 nameAndType 找到方法名和返回值。
这时候我手里有 类名/方法名/方法返回值,下一步,我通过类名和方法名,通过JVM记录的方法列表,找到对应的方法体。 而这个方法体实际上是一段内存地址,那么这时候我就把这段内存地址复制给 #2,并且给 #2设定一个已经解析的 flag。 这样就完成了符号引用到直接引用的过程。

类加载器

双亲委派模型

类型

类加载器通常包含四种类型,

  • 启动类加载器:负责加载存放在<JAVA_HOME>\lib目录
  • 扩展类加载器:负责加载<JAVA_HOEM>\lib\ext目录
  • 应用程序类加载器:加载用户类路径上的所有类库,如果没有定义自定义类加载器,通常情况下该加载器就是默认的类加载器
  • 自定义类加载器:重新一个类加载器的findClass()或者loadClass()方法,控制字节流获取

image.png

双亲委派模型要求除了顶层的启动类加载器外,其余的类加载器都应用自己的父类加载器,通常情况使用组合关系来复用父类加载器的代码实现父子关系

工作流程

双亲委派模型的工作流程:
如果一个类加载器收到了类加载的请求,他首先不会自己取尝试加载这个类,而是把这个请求委派给父类加载器去完成,每一个层次的类加载器都是如此,因此所有的加载请求最终都应该传送到最顶层的启动类加载器中,只有当父加载器反馈自己无法完成这个加载请求(它的搜索范围中没有找到所需的类)时,子加载器才会尝试自己去完成加载。

image.png

特性

  • 对于任意一个类,都必须由加载它的类加载器和这个类本身一起共同确立其在Java虚拟机中的唯一性。比较两个类是否“相等”,只有在这两个类是由同一个类加载器加载的前提下才有意义。(“相等”包括代表类的Class对象的equals()方法、isAssignableFrom()方法、isInstance()方法,也包括了使用instanceof关键字做对象所属关系判定等各种情况)
  • 使用双亲委派模型显而易见的一个好处就是Java中的类随着它的类加载器一起具备了一种带有优先级的层次关系。例如java.lang.Object类,无论哪一个类加载器加载它,最终都会委派给启动累加载器,因此Object类在程序中的各种类加载器环境中都能保证是同一个类。

参考文献

  1. 深入理解Java虚拟机(第三版)
  2. 什么是双亲委派机制?
  3. 类的加载过程详解
  4. class文件反编译成java文件_深入理解Class文件结构