Java类加载器

506 阅读14分钟

将类的.class文件读入内存,并为之创建一个java.lang.Class的对象,而.class文件只有被确的加载到JVM正中才能运行和使用。

一、类加载的过程

类从被加载到虚拟机内存中开始,到卸载出内存为止,它的生命周期包括了:加载(Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化(Initialization)、使用(Using)、卸载(Unloading)七个阶段,其中验证、准备、解析三个部分统称链接。

加载

加载阶段是“类加载机制”中的一个阶段,这个阶段通常也被称作“装载”,主要完成:

  • 通过“类全名”来获取定义此类的二进制字节流
  • 将字节流所代表的静态存储结构转换为方法区的运行时数据结构
  • java堆中生成一个代表这个类的java.lang.Class对象,作为方法区这些数据的访问入口

验证

验证是连接阶段的第一步,这一阶段的目的是为了确保Class文件的字节流中包含的信息符合虚拟机的要求,并且不会危害虚拟机自身的安全。验证阶段大致会完成以下4个阶段的校验动作:文件格式验证、元数据验证、字节码验证和符号引用验证。

1.文件格式验证

这一阶段目的是验证二进制字节流是否符合Class文件格式的规范,并且能被当前版本的虚拟机处理,检测内容包括以下几点:

  • 是否以魔数(0xCAFEBABY)开头。
  • 主次版本号是否在当前虚拟机处理范围之内。
  • 常量池中的常量是否有不支持的常量类型。
  • 指向常量的各种索引值中是否有指向不存在的常量或不符合类型的常量。
  • CONSTANT_Utf8_info 型常量是否有不符合UTF8数据编码的数据。
  • Class文件中各个部分及文件本身是否有被删除的或附加的信息。

2.元数据验证

这一阶段主要对字节码的描述信息进行语义分析,以保证其描述信息符合java语言规范,这阶段的验证点可能包括以下几点:

  • 这个类是否有父类
  • 这个类的父类是否继承了不被允许继承的类(被final修饰)
  • 如果这个类不是抽象类,是否实现了父类或接口中的方法
  • 类中的字段、方法是否与父类产生矛盾(覆盖父类的final字段值等)

3.字节码验证

这一阶段目的主要目的是确定程序语义是合法的、符合逻辑的。这个阶段主要对类的字节码进行校验分析,保证该类的方法不会在运行时做出危害虚拟机安全的事:

  • 保证任意时刻操作数栈的数据类型与指令代码序列都能配合工作,例如不会出险操作数栈上 int 类型的数据使用时按long类型加载进本地变量表中。
  • 保证跳转指令不会跳转到方法体以外的字节码指令上。
  • 保证方法体内的类型转化是有效的,可以把一个子类对象赋值给父类数据结构,这是安全的,而不能把父类赋值给子类甚至与它无关系的数据类型,这是危险和不合法的。

4.符号引用验证

这一阶段用来将符号引用转换为直接引用的时候,这个转化将在解析阶段中发生,符号引用验证可以看做是类对自身以外(常量池中各种符号引用)的信息进行匹配性校验,通常需要校验以下内容:

  • 符号引用中能否根据字符串的权限定名找到对应的类。
  • 在指定类中是否存在符合方法的字段描述符以及简单名称描述的方法和字段。
  • 符号引用中的类、字段、方法的访问性是否可以被当前类访问。

准备

准备阶段是正式为类变量分配内存并设置初始值的阶段,这些变量所使用的内存都将在方法区分配。实例变量会在对象实例化的时候跟对象一起在java堆中分配。这里的初始值指的是通常情况下的零值。假设一个类变量定义为:

public static int a=123;

那么变量a初始化的值是0而不是123。如果变量同时是final类型,那么准备阶段就会被赋值为123,不必等到初始化阶段再赋值。

解析

解析阶段是将虚拟机常量池内的符号引用替换为直接引用的过程。解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符7类符号进行。可能大家有疑问Class文件中哪有这么多内容,其实上面也说了,是针对常量池。不管是CLass文件中的方法表还是字段表,不能直接表示的内容,基本都会直接或间接存在常量池中,因此解析过程就是针对常量池中的数据类型进行解析的。

1.类或接口的解析

要把一个从未解析过的符号引用N解析为一个类或接口的直接引用,虚拟机需要完成以下3个步骤:

  • 如果C不是一个数组类型,那么虚拟机会把代表N的权限定名传递给D的类加载器去加载这个类C。在加载的过程当中,由于元数据、字节码验证的操作,又可能触发其它类的加载动作,一旦出险任何异常,则解析宣告失败。
  • 如果C是一个数组类型,并且数组元素为对象,描述符类似“[Ljava/lang/Integer”的形式按照第一点的规则加载数组元素类型。如果N的描述符如前面所假设的形式,需要加载的类型就是java.lang.Integer,接着由虚拟机生成一个代表次数组维度和元素的数组对象。
  • 如果上面的步骤没有任何异常,那么C在虚拟机中实际上已经称为一个有效的类或接口了。解析之前还要进行符号验证,确认D是否具有对C的访问权限,如果不具备则会抛出异常。

2.字段解析

对字段表内class_index项中索引的CONSTANT_Class_info符号引用进行解析,也就是字段所属的类或接口的符号引用,如果解析这个类或符号引用的过程中出现任何异常,都会导致字段符号引用解析的失败。如果解析成功,这个字段对应的类或接口用C表示,接下来沿着A和它的父类/父接口寻找是否有这个字段,如果有会进行权限验证,如果不具备权限则抛出异常。如果这个过程不出错,则会在找到符合字段的时候返回这个字段的直接饮用,查找结束。

3.类(静态)方法解析类方法解析

  • 首先也要首先解析出类方法表class_index项中索引的方法所属的类或接口的符号引用,解析成功用C表示。
  • 类方法和接口方法符号引用的常量类型定义是分开的,如果在类方法表中索引类是个接口,直接抛出异常。
  • 如果通过了第一步,在类C中查找是否有简单名称和描述符都与目标匹配的方法,有则返回这个方法的直接引用,查找结束。
  • 否则在类的父类递归查找是否有这个方法,有则返回直接引用,查找结束。
  • 否则在类的接口列表和父接口递归查找,如果存在匹配的方法,说明类C是一个抽象类,查找结束,抛出异常。
  • 否则宣告查找失败,抛出异常。
  • 最后如果查找成功返回了直接引用,还要对这个方法进行权限验证,如果不具备权限,则会抛出异常。

4.接口方法解析

接口方法需要先解析出接口方法表的class_index项中索引的方法所属的类或接口的符号引用。

  • 如果发现class_index中的索引C是个类而不是接口,直接抛出异常。
  • 否则在接口C中查找是否有描述符和名称都匹配的方法,有则返回方法的直接引用,查找结束。
  • 否则在其父接口中递归查找,匹配就返回方法的直接引用,查找结束。
  • 否则宣告方法查找失败。

初始化

类的初始化阶段是类加载过程的最后一步,在准备阶段,类变量已赋过一次系统要求的初始值,而在初始化阶段,则是根据程序员通过程序制定的主观计划去初始化类变量和其他资源,或者可以从另外一个角度来表达:初始化阶段是执行类构造器()方法的过程。

在以下四种情况下初始化过程会被触发执行:

  • 1.遇到new、getstatic、putstatic或invokestatic这4条字节码指令时,如果类没有进行过初始化,则需先触发其初始化。生成这4条指令的最常见的java代码场景是:使用new关键字实例化对象、读取或设置一个类的静态字段(被final修饰、已在编译器把结果放入常量池的静态字段除外)的时候,以及调用类的静态方法的时候。
  • 2.使用java.lang.reflect包的方法对类进行反射调用的时候
  • 3.当初始化一个类的时候,如果发现其父类还没有进行过初始化、则需要先出发其父类的初始化
  • 4.jvm启动时,用户指定一个执行的主类(包含main方法的那个类),虚拟机会先初始化这个类

初始化类的方法

  • 初始化,也就是new时候会初始化类
  • 访问类或者接口中的静态变量或者对其赋值
  • 调用类的静态方法
  • 反射Class.forName("com.geminno");
  • 初始化它的子类,父类也会初始化
  • 虚拟机启动时被标明是启动类的类(java Test),直接用java.exe运行某个类;

类中成员初始化的顺序:

父类的静态字段——>父类静态代码块——>子类静态字段——>子类静态代码块——>父类成员变量(非静态字段)——>父类非静态代码块——>父类构造器——>子类成员变量——>子类非静态代码块——>子类构造器

二、类加载器

1.类与类加载器

对于任何一个类,都需要由加载它的类加载器和这个类来确立其在JVM中的唯一性。也就是说,两个类来源于同一个Class文件,并且被同一个类加载器加载,这两个类才相等。

2.双亲委派模型

从虚拟机的角度来说,只存在两种不同的类加载器:一种是启动类加载器(Bootstrap ClassLoader),该类加载器使用C++语言实现,属于虚拟机自身的一部分。另外一种就是所有其它的类加载器,这些类加载器是由Java语言实现,独立于JVM外部,并且全部继承自抽象类java.lang.ClassLoader

大部分Java程序一般会使用到以下三种系统提供的类加载器:

启动类加载器(Bootstrap ClassLoader):负责加载JAVA_HOME\lib目录中并且能被虚拟机识别的类库到JVM内存中,如果名称不符合的类库即使放在lib目录中也不会被加载。该类加载器无法被Java程序直接引用。
扩展类加载器(Extension ClassLoader):该加载器主要是负责加载JAVA_HOME\lib\,该加载器可以被开发者直接使用。
应用程序类加载器(Application ClassLoader):该类加载器也称为系统类加载器,它负责加载用户类路径(Classpath)上所指定的类库,开发者可以直接使用该类加载器,如果应用程序中没有自定义过自己的类加载器,一般情况下这个就是程序中默认的类加载器。

双亲委派模型的源码实现:

主要体现在ClassLoaderloadClass()方法中,思路很简单:先检查是否已经被加载过,若没有加载则调用父类加载器的loadClass()方法,若父类加载器为空则默认使用启动类加载器作为父类加载器。如果父类加载器加载失败,抛出ClassNotFoundException异常后,调用自己的findClass()方法进行加载。

三.自定义类加载器

若要实现自定义类加载器,只需要继承java.lang.ClassLoader类,并且重写其findClass()方法即可java.lang.ClassLoader 类的基本职责就是根据一个指定的类的名称,找到或者生成其对应的字节代码,然后从这些字节代码中定义出一个Java 类,即java.lang.Class类的一个实例。除此之外,ClassLoader还负责加载Java 应用所需的资源,如图像文件和配置文件等,ClassLoader中与加载类相关的方法如下:

方法说明

getParent()  返回该类加载器的父类加载器。

loadClass(String name) 加载名称为 二进制名称为name 的类,返回的结果是 java.lang.Class 类的实例。

findClass(String name) 查找名称为 name 的类,返回的结果是 java.lang.Class 类的实例。

findLoadedClass(String name) 查找名称为 name 的已经被加载过的类,返回的结果是 java.lang.Class 类的实例。

resolveClass(Class<?> c) 链接指定的 Java 类。
    /**
	 * 一、ClassLoader加载类的顺序
	 *  1.调用 findLoadedClass(String) 来检查是否已经加载类。
	 *  2.在父类加载器上调用 loadClass 方法。如果父类加载器为 null,则使用虚拟机的内置类加载器。
	 *  3.调用 findClass(String) 方法查找类。
	 * 二、实现自己的类加载器
	 *  1.获取类的class文件的字节数组
	 *  2.将字节数组转换为Class类的实例
	 * @author lei 2011-9-1
	 */
	public class ClassLoaderTest {
	    public static void main(String[] args) throws InstantiationException, IllegalAccessException, ClassNotFoundException {
	        //新建一个类加载器
	        MyClassLoader cl = new MyClassLoader("myClassLoader");
	        //加载类,得到Class对象
	        Class<?> clazz = cl.loadClass("classloader.Animal");
	        //得到类的实例
	        Animal animal=(Animal) clazz.newInstance();
	        animal.say();
	    }
	}
	class Animal{
	    public void say(){
	        System.out.println("hello world!");
	    }
	}
	class MyClassLoader extends ClassLoader {
	    //类加载器的名称
	    private String name;
	    //类存放的路径
	    private String path = "E:\\workspace\\Algorithm\\src";
	    MyClassLoader(String name) {
	        this.name = name;
	    }
	    MyClassLoader(ClassLoader parent, String name) {
	        super(parent);
	        this.name = name;
	    }
	    /**
	     * 重写findClass方法
	     */
	    @Override
	    public Class<?> findClass(String name) {
	        byte[] data = loadClassData(name);
	        return this.defineClass(name, data, 0, data.length);
	    }
	    public byte[] loadClassData(String name) {
	        try {
	            name = name.replace(".", "//");
	            FileInputStream is = new FileInputStream(new File(path + name + ".class"));
	            ByteArrayOutputStream baos = new ByteArrayOutputStream();
	            int b = 0;
	            while ((b = is.read()) != -1) {
	                baos.write(b);
	            }
	            return baos.toByteArray();
	        } catch (Exception e) {
	            e.printStackTrace();
	        }
	        return null;
	    }
	}

四.问题

1.根据类加载器加载类的初始化原理,推断以下代码的输入结果为?

public class Test {
    public static void main(String[] args) throws Exception{
      ClassLoader classLoader=ClassLoader.getSystemClassLoader();
      Class clazz=classLoader.loadClass("A");
      System.out.print("Test");
      clazz.forName("A");
    }
}

class A{
    static {
        System.out.print("A");
    }
}

解答:

2.继承是JAVA语言的一个特性,针对类的继承,虚拟机会如何进行父类和子类的初始化加载呢?请阅读代码选择出该段代码的输入结果?

public class Test {
    public static void main(String[] args) {
        System.out.print(B.c);
    }
}

class A {
    public static String c = "C";
    static {
        System.out.print("A");
    }
}

class B extends A{
    static {
        System.out.print("B");
    }
}

解答:

3.JAVA的类加载期负责整个生命周期内的class的初始化和加载工作,就虚拟机的规范来说,以下代码会输出什么结果?

public class Test {
    public static void main(String[] args) {
        System.out.println(Test2.a);
    }
}

class Test2{
    public static final String a=new String("JD");
    static {
        System.out.print("OK");
    }
}

解答:

4.能不能自己写个类叫java.lang.System

答案:通常不可以,但可以采取另类方法达到这个需求。
解释:为了不让我们写System类,类加载采用委托机制,这样可以保证爸爸们优先,爸爸们能找到的类,儿子就没有机会加载。而System是Bootstrap加载器加载的,就算自己重写,也总是使用Java系统提供的System,自己写的System类根本没有机会得到加载。 但是,我们可以自己定义一个类加载器来达到这个目的,为了避免双亲委托机制,这个类加载器也必须是特殊的。由于系统自带的三个类加载器都加载特定目录下的类,如果我们自己的类加载器放在一个特殊的目录,那么系统的加载器就无法加载,也就是最终还是由我们自己的加载器加载。

引用参考:
juejin.cn/post/684490…
blog.csdn.net/boyupeng/ar…
blog.csdn.net/boyupeng/ar…

备注:文章内容还在深入学习,会不断修改跟新!