JVM(二)—— 对象的创建、内存布局以及访问定位

103 阅读5分钟

JVM系列文章:

  1. JVM(一)—— JVM内存管理
  2. JVM(二)—— 对象的创建、内存布局以及访问定位

1. 对象的创建过程

下图为对象的创建过程:

image.png

1.1 第一步:类加载检查

当Java虚拟机遇到一条字节码new指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有,那必须先执行相应的类加载过程。

1.2 第二步:为对象分配内存

对象所需的内存大小在类加载完成后就可以确定。

内存分配方式

根据Java堆中内存是否绝对规整,有两种不同的内存分配方式:指针碰撞空闲列表

  1. 指针碰撞——Java堆中内存绝对规整

    所有被使用过的内存都被放在一边,空闲的内存被放在另一边,中间放着一个指针作为分界点的指示器,那所分配内存就仅仅是把那个指针向空闲空间方向挪动一段与对象大小相等的距离。

    image.png

  2. 空闲列表——Java堆中内存不绝对规整

    已被使用的内存和空闲的内存相互交错在一起了。这时,虚拟机就必须维护一个列表,记录上哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录。

    Java堆是否规整由所采用的垃圾收集器是否带有空间压缩整理(Compact)的能力决定。

分配内存时的并发安全问题

对象创建在虚拟机中是非常频繁的行为,即使仅仅修改一个指针所指向的位置,在并发情况下也并不是线程安全的,可能出现正在给对象A分配内存,指针还没来得及修改,对象B又同时使用了原来的指针来分配内存的情况。

  1. CAS + 失败重试 —— 对分配内存空间的动作进行同步处理

    保证更新操作的原子性。

  2. 本地线程分配缓冲(Thread Local AllocationBuffer,TLAB) —— 把内存分配的动作按照线程划分在不同的空间之中进行

    每个线程在java堆中预先分配一小块内存。哪个线程要分配内存,就在哪个线程的本地缓冲区中分配,只有本地缓冲区用完了,分配新的缓存区时才需要同步锁定。

1.3 第三步:将内存空间初始化

内存分配完成之后,虚拟机必须将分配到的内存空间(但不包括对象头)都初始化为零值。保证了对象的实例字段在Java代码中可以不赋初始值就直接使用,使程序能访问到这些字段的数据类型所对应的零值。

1.4 第四步:对对象进行必要的设置

Java虚拟机还要对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码(实际上对象的哈希码会延后到真正调用Object::hashCode()方法时才计算)、对象的GC分代年龄等信息。这些信息存放在对象的对象头(Object Header)之中。根据虚拟机当前运行状态的不同,如是否启用偏向锁等,对象头会有不同的设置方式。

1.5 第五步:对象初始化

在上面工作都完成之后,从虚拟机的视角来看,一个新的对象已经产生了。

但是从Java程序的视角看来,对象创建才刚刚开始,Class文件中的<init>()方法还没有执行,所有的字段都为默认的零值,对象需要的其他资源和状态信息也还没有按照预定的意图构造好。一般来说(由字节码流中new指令后面是否跟随invokespecial指令所决定,Java编译器会在遇到new关键字的地方同时生成这两条字节码指令,但如果直接通过其他方式产生的则不一定如此),new指令之后会接着执行<init>()方法,按照程序员的意愿对对象进行初始化,这样一个真正可用的对象才算完全被构造出来。

2. 对象的内存布局

在HotSpot虚拟机里,对象在堆内存中的存储布局可以划分为三个部分:对象头(Header)、实例数据(Instance Data)和对齐填充(Padding)。

image.png

3. 对象的访问定位

Java程序会通过栈上的reference数据来操作堆上的具体对象。对象访问方式也是由虚拟机实现而定的,访问方式主要有两种:使用句柄直接指针

  1. 使用句柄

    Java堆中将可能会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自具体的地址信息。

    image.png

    使用句柄来访问的最大好处就是reference中存储的是稳定句柄地址,在对象被移动(垃圾收集时移动对象是非常普遍的行为)时只会改变句柄中的实例数据指针,而reference本身不需要被修改。

  2. 直接指针

    Java堆中对象的内存布局就须考虑如何放置访问类型数据的相关信息,reference中存储的直接就是对象地址,如果只是访问对象本身的话,就不需要多一次间接访问的开销。

    image.png