文中虚拟机特指HotSpot,对象指普通的Java对象
本文探讨虚拟机在Java堆中对象分配、布局、访问的过程。
一、对象的创建
常见的创建对象就是一个new关键字。
当虚拟机遇到一条字节码new指令时,首先检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有则执行相应的类加载过程。(以前的文章写过类加载的过程)
类加载检查通过后,虚拟机将为新生对象分配内存,对象所需内存的大小在类加载完成后便可完全确定。为对象分配空间的任务实际上等同于把一块确定大小的内存块从Java堆中划分出来,但是由于Java堆在逻辑上是连续的,所以存在两种情况。
1、Java堆的内存是绝对规整的(在物理上是连续的)所有被使用过的内存都放在一边,空闲
的内存放在另一边,中间放着一个指针作为分界点的指示器,所分配内存就是把那个指针向空闲空间方向挪动一段与对象大小相等的距离,这种分配方式被称为“指针碰撞”。
2、如果Java堆中的内存并不规整,已被使用的内存和空闲的内存相互交错在一起,虚拟机就
必须维护一个列表记录哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间分给对象实例并更新列表,这种分配方式被称为“空闲列表”。
选择何种方式由Java堆是否规整决定,而Java堆是否规整又由所采用的垃圾收集器是否带有空间压缩整理的能力决定。
由于Java对象的频繁创建,保证并发情况下的线程安全是非常重要的,一般有以下两种方案:
1、对分配内存空间的动作进行同步处理,实际上虚拟机采用CAS配上失败重试的方式保证更新操作的原子性。
2、把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆这预先分配一小块内存,称为本地线程分配缓冲(TLAB)哪个线程要分配内存,就在其本地缓冲中进行分配,只有本地缓冲用完了,分配新的缓冲区时才需要同步锁定。可以通过-XX:+/-UseTLAB参数来决定是否使用
内存分配完成之后,虚拟机必须将分配到的内存空间都初始化为零值,保证了对象的实例字段在Java代码中可以不赋初始值就可以直接使用。
Java虚拟机还要对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的分代信息等。
在new指令之后会接着执行<init>()方法(对象的构造函数),按照程序员的意愿对对象进行初始化。
二、对象的内存布局
对象在堆内存中的存储布局可以划分为三部分:对象头、实例数据、对齐填充
1、对象头Header
它包括两类信息:
第一类是用于存储对象自身的运行时数据如哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。
第二类是类型指针,即对象指向它的类型数据的指针,虚拟机通过这个指针来确定该对象是哪个类的实例。
更具体的对象头信息请参考《深入理解Java虚拟机》
2、实例数据
这部分是对象真正存储的有效信息
3、对齐填充
为了保证任何对象的大小都必须是8字节的整数倍(虚拟机的自动内存管理系统要求对象起始地址必须是8字节的整数倍)
三、对象的访问定位
Java程序会通过栈上的reference数据来操作堆上的具体对象,对象的访问方式是由虚拟机的实现而定的。
主流的方式有使用句柄和直接指针两种:
1、如果使用句柄访问的话,Java堆中将可能会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄这包含了对象实例数据与类型数据各自具体的地址信息。
2、如果使用直接指针访问的话,Java堆中对象的内存布局就必须考虑如何放置访问类型数据的相关信息,reference中存储的就是对象地址,如果只是访问对象本事,就不需要多一次间接访问的开销。(HotSpot使用)
欢迎关注我的微信公众号,分享leetcode解题心得和Java后端的相关知识
