这一部分主要以 HotSpot 虚拟机为例,探究一下在 Java 堆中对象分配、布局和访问的全过程。
对象的创建
- 虚拟机遇到一条 new 指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有则先执行相应的类加载过程。
- 类加载检查通过后,虚拟机将为新生对象分配内存。
- 指针碰撞:假设 Java 堆中内存是绝对规整的,即所有用过的内存都放在一边,空闲的内存放在另一边,中间放着一个指针作为分界点的指示器,那所分配内存就仅仅是把那个指针向空闲空间那边挪动一段距离,这种分配方式称为“指针碰撞”(Bump the Pointer)。当使用基于标记整理或标记复制的收集器(如 Serial、Parnew 等)时,可以采用简单高效的指针碰撞法。
- 空闲链表:如果 Java 堆中的内存并不是规整的,已使用的内存和空闲的内存相互交错,那就没有办法简单地进行指针碰撞了。虚拟机必须维护一个列表,记录上哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录,这种分配方式称为“空闲列表”(FreeList)。当使用基于标记清除的收集器(如 CMS 等)时,只能使用复杂的空闲链表法。
新生对象内存的分配是非线程安全的,因此有两种解决方案:
- 采用 CAS 配上失败重试的方式保证更新操作的原子性;
- 每个线程在 Java 堆中预先分配一小块本地线程分配缓冲,哪个线程要分配内存,优先在它的 TLAB 中分配。是否使用 TLAB 可以通过
-XX:+/-UseTLAB
参数来设定。
- 内存分配完成后,虚拟机需要将分配到的内存空间都初始化为零值(不包括对象头)。如果使用 TLAB,这一工作过程也可以提前至 TLAB 分配时进行。
- 接下来,虚拟机要对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。这些信息都存放在对象的对象头中。
- 至此,从虚拟机的视角来看,一个新的对象已经产生了。但是从 Java 程序的视角来看,对象的创建才刚刚开始。接下来,new 指令之后会接着执行 Class 文件中的
<init>
方法,按照程序员的意愿对对象进行初始化,这样一个可用的对象才算完全被构造出来。
对象的内存布局
在HotSpot虚拟机中,对象在内存中存储的布局可以分为3块区域:对象头(Header)、 实例数据(Instance Data)和对齐填充(Padding)。
-
对象头
- 对象头的第一部分用于存储对象自身的运行时数据,如哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等,这部分被称为
Mark Word
。这一部分仅使用 32 或 64 bit 的 Bitmap 来记录(根据不同位数的虚拟机),对于不同的标志位状态,Mark Word
存储不同的内容,以达到对象复用,节省空间的目的,具体如下图。
- 对象头的另外一部分是类型指针,即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例,如果对象是一个 Java 数组,那在对象头中还必须有一块用于记录数组长度的数据。
- 对象头的第一部分用于存储对象自身的运行时数据,如哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等,这部分被称为
-
实例数据
- 实例数据部分是对象真正存储的有效信息,也是在程序代码中所定义的各种类型的字段内容。
-
对齐填充
- 由于 HotSpot VM 的自动内存管理系统要求对象起始地址必须是 8 字节的整数倍。对象头部分已经被设计成是 8 字节的倍数,如果对象实例数据部分没有对齐,就需要通过对齐填充来补全。
对象的访问定位
我们的Java程序需要通过栈上的 reference 数据来操作堆上的具体对象。由于 reference 类型在 Java 虚拟机规范中只规定了一个指向对象的引用,并没有定义这个引用应该通过何种方式去定位、访问堆中的对象的具体位置,所以对象访问方式也是取决于虚拟机实现而定的。目前主流的访问方式有使用句柄和直接指针两种。
- 句柄访问
- 句柄通俗来讲就是指针的指针。如果使用句柄访问对象的话,会在 JAVA 堆中划出一部分内存作为句柄池,reference 中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据的各自具体的地址信息。
- 直接访问
- 直接指针的好处就是速度快,它节省了一次指针定位的时间开销,由于对象访问在 Java 中是非常平繁的,因此这类开销积少成多也是一项极为可观的执行成本。
句柄访问的优点:当对象被移动时(比如GC时),只需更改句柄中的实例数据指针,而 reference 不需要改变。这样做的好处是如果一个对象被多个 reference 所引用,那么当对象地址被修改时,只需更改一个句柄地址即可。
直接访问的优点:定位对象时只需一次寻址,速度更快。HotSpot 中主要使用直接访问的方式来定位对象。