JVM对象创建和对齐填充详解

1,884 阅读6分钟

1.虚拟机对象创建

​ 语言层面上,创建对象通常(例外:复制、反序列化)仅仅是一个new关键字而已,本文所探讨的虚拟机对象创建不包含数组和Class对象等,就对于普通对象而言。

  1. 常量池中定位符号引用

    • Java虚拟机遇到一条字节码new指令时,检查指令的参数能否在常量池中定位一个符号引用。
  2. 检查类是否被加载

    • 检查这个符号引用代表的类是否已被加载、解析和初始化过。
  3. 类加载过程

    • 确定所加载类占用内存大小,并划分空间进行存储
    • 划分空间两种方式
      • 指针碰撞,堆内存规整
        • 所代表的垃圾收集器有Serial、ParNew,用算法标记-整理算法
        • 可能导致线程不安全问题,可看下方tip1:指针碰撞所带来的线程安全问题。
      • 空闲列表
        • 所代表的垃圾收集器CMS,采用标记清除算法
    • 对象设置
      • 虚拟机还要对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码对象的GC分代年龄等信息。。这些信息存放在对象的对象头(Tip2:对象都存储内容)之中。

    上面工作都完成之后,从虚拟机的视角来看,一个新的对象已经产生了。但是从Java程序的视角看来,对象创建才刚刚开始——构造函数,即Class文件中的()方法还没有执行,所有的字段都为默认的零值。梳理完虚拟机对象创建过程后,在来看看对象在堆内存的存储布局.

2.对象的内存布局

在HotSpot虚拟机里,对象在堆内存中的存储布局可以划分为三个部分:对象头(Header)、实例数据(Instance Data)和对齐填充(Padding)。

2.1对象头

HotSpot虚拟机对象的对象头部分包括两类信息:

  1. 第一类是用于存储对象自身的运行时数据,如哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等,官方称它为“Mark Word”。
  2. 第二类类型指针

2.2实例数据

​ 实例数据部分是对象真正存储的有效信息,即我们在程序代码里面所定义的各种类型的字段内容,无论是从父类继承下来的,还是在子类中定义的字段都必须记录起来。这部分的存储顺序会受到虚拟机分配策略参数(-XX:FieldsAllocationStyle参数)和字段在Java源码中定义顺序的影响。

​ HotSpot虚拟机默认的分配顺序为longs/doublesintsshorts/charsbytes/booleans、oops。

​ 从以上默认的分配策略中可以看到,相同宽度的字段总是被分配到一起存放,在满足这个前提条件的情况下,在父类中定义的变量会出现在子类之前。

​ 对象的第三部分是对齐填充,这并不是必然存在的,也没有特别的含义,它仅仅起着占位符的作用。

2.3对齐填充

​ 由于HotSpot虚拟机的自动内存管理系统要求对象起始地址必须是8字节的整数倍,换句话说就是任何对象的大小都必须是8字节的整数倍。对象头部分已经被精心设计成正好是8字节的倍数(1倍或者2倍),因此,如果对象实例数据部分没有对齐的话,就需要通过对齐填充来补全。

​ 总的一句话来说,“数据项仅仅能存储在地址是数据项大小的整数倍的内存位置上(分别为偶地址、被4整除的地址、被8整除的地址)”比如int类型占用4个字节,地址仅仅能在0,4,8等位置上。

​ 要讲好对齐填充,其实还是得去了解c++实现。

例1:

#include <stdio.h>
struct xx{
    char b;
    int a;
    int c;
    char d;
};   //总体结构用了16个字节

struct xx{
        char b; 
        char d;
        int a;          
        int c;                  
};	//总体结构占用12个字节

只说结论,过程可以将对应得字段地址打印出来。

会发现b之后填充3字节,d之后也会填充3字节,这儿就体现了对齐填充,平时代码,分类要做好,对齐填充也要注意。

Tip1:指针碰撞所带来的线程安全问题。

​ 对象创建在虚拟机中是非常频繁的行为,即使仅仅修改一个指针所指向的位置,在并发情况下也并不是线程安全的,可能出现正在给对象A分配内存,指针还没来得及修改,对象B又同时使用了原来的指针来分配内存的情况。解决这个问题有两种可选方案:

  1. 一种是对分配内存空间的动作进行同步处理——实际上虚拟机是采用CAS配上失败重试的方式保证更新操作的原子性;
  2. 另外一种是把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓冲(Thread Local AllocationBuffer,TLAB),哪个线程要分配内存,就在哪个线程的本地缓冲区中分配,只有本地缓冲区用完了,分配新的缓存区时才需要同步处理。虚拟机是否使用TLAB,可以通过-XX:+/-UseTLAB参数来设定。

Tip2:对象头存储内容

对象头又称"Mark Word"。定义了一个有着动态数据的数据结构例如在32位的HotSpot虚拟机中,如对象未被同步锁锁定的状态下,Mark Word的32个比特存储空间中的25个比特用于存储对象哈希码4个比特用于存储对象分代年龄2个比特用于存储锁标志位1个比特固定为0,在其他状态(轻量级锁定、重量级锁定、GC标记、可偏向)下对象的存储内容如表所示。 对象头的另外一部分是类型指针,即对象指向它的类型元数据的指针,Java虚拟机通过这个指针来确定该对象是哪个类的实例。