一、对象的创建
当Java虚拟机遇到一条字节码new指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有,那必须先执行相应的类加载过程。
在类加载检查通过后,接下来虚拟机将为新生对象分配内存。对象所需内存的大小在类加载完成后便可完全确定,为对象分配空间的任务实际上便等同于把一块确定大小的内存块从Java堆中划分出来。
在内存分配方面:1、如果java堆中内存是绝对规整的,可采用“指针碰撞”(Bump The Pointer)的分配方式;
2、如果java堆中内存并不是规整的,需采用“空闲列表”(Free List)的分配方式。
Java堆是否规整由所采用的垃圾收集器是否带有 空间压缩整理(Compact)的能力决定。因此,当使用Serial、ParNew等带压缩整理过程的收集器时,系统采用的分配算法是指针碰撞,既简单又高效;而当使用CMS这种基于清除 (Sweep)算法的收集器时,理论上就只能采用较为复杂的空闲列表来分配内存。
内存分配完成之后,虚拟机必须将分配到的内存空间(但不包括对象头)都初始化为零值,如果使用了TLAB的话,这一项工作也可以提前至TLAB分配时顺便进行。接下来,需要对对象的类信息、元数据信息、对象的哈希码、GC分代年龄等信息,存放在对象头(Object Header)之中。至此,完成对象的创建。
总结 对象创建的步骤:
1、判断对象对应的类是否加载、链接、初始化
2、为对象分配内存
3、处理并发安全问题
4、初始化分配到的空间
5、设置对象的对象头
6、执行init方法进行初始化
HotSpot解释器代码片段
// 确保常量池中存放的是已解释的类
if (!constants->tag_at(index).is_unresolved_klass()) {
// 断言确保是klassOop和instanceKlassOop(这部分下一节介绍)
oop entry = (klassOop) *constants->obj_at_addr(index);
assert(entry->is_klass(), "Should be resolved klass");
klassOop k_entry = (klassOop) entry;
assert(k_entry->klass_part()->oop_is_instance(), "Should be instanceKlass");
instanceKlass* ik = (instanceKlass*) k_entry->klass_part();
// 确保对象所属类型已经经过初始化阶段
if ( ik->is_initialized() && ik->can_be_fastpath_allocated() ) {
// 取对象长度
size_t obj_size = ik->size_helper(); oop result = NULL;
// 记录是否需要将对象所有字段置零值
bool need_zero = !ZeroTLAB;
// 是否在TLAB中分配对象
if (UseTLAB) { result = (oop) THREAD->tlab().allocate(obj_size); }if (result == NULL) { need_zero = true;
// 直接在eden中分配对象
retry: HeapWord* compare_to = *Universe::heap()->top_addr(); HeapWord* new_top = compare_to + obj_size;
// cmpxchg是x86中的CAS指令,这里是一个C++方法,通过CAS方式分配空间,并发失败的话,转到retry中重试直至成功分配为止
if (new_top <= *Universe::heap()->end_addr()) {
if (Atomic::cmpxchg_ptr(new_top, Universe::heap()->top_addr(), compare_to) != compare_to) {
goto retry;
}result = (oop) compare_to;
}
}if (result != NULL) {
// 如果需要,为对象初始化零值
if (need_zero ) {
HeapWord* to_zero = (HeapWord*) result + sizeof(oopDesc) / oopSize;
obj_size -= sizeof(oopDesc) / oopSize;
if (obj_size > 0 ) {
memset(to_zero, 0, obj_size * HeapWordSize);
}
}
// 根据是否启用偏向锁,设置对象头信息
if (UseBiasedLocking) {
result->set_mark(ik->prototype_header());
} else {
result->set_mark(markOopDesc::prototype());
}result->set_klass_gap(0);
result->set_klass(k_entry);
// 将对象引用入栈,继续执行下一条指令
SET_STACK_OBJECT(result, 0);
UPDATE_PC_AND_TOS_AND_CONTINUE(3, 1);
}
}
}
对象创建的线程安全问题
对象的创建在虚拟机中非常的频繁,在并发情况下,线程是不安全的。
因此为了解决线程安全问题,有两种方案:
- 对分配内存空间的动作进行同步处理——实际上虚拟机是采用CAS配上失败重试的方式保证更新操作的原子性;
- 把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓冲(Thread Local Allocation Buffer,TLAB),哪个线程要分配内存,就在哪个线程的本地缓冲区中分配,只有本地缓冲区用完了,分配新的缓存区时才需要同步锁定。【虚拟机是否使用TLAB,可以通过-XX:+/-UseTLAB参数来设定】
二、对象的内存布局
在HotSpot虚拟机中,对象在堆内存中存储布局分为三个部分:对象头(Header)、实例数据(Instance Data)和对齐填充(Padding)。
2.1 对象头
对象头主要分为运行时元数据(MarkWord) 和类型指针(Class Pointer)两大部分。
2.1.1、运行时元数据
运行时元数据(MarkWord )主要用于存储对象自身的运行时数据,有哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。
Mark Word在32位和64位的虚拟机中分别为32bit和64bit。
如下图在64位的虚拟机中,Mark Word64位的结构依据不同的锁状态,来分别存储不同的信息。
同时,需要注意的是末两位,记录的是锁标志位,标志位对应的存储内容参考下表
2.1.2、类型指针
类型指针(Class Pointer)是对象指向它的类型元数据的指针
2.2 实例数据
实例数据(Instance Data)保存了对象的有效信息,即在java代码中定义的字段内容。
存储顺序会受到虚拟机 分配策略参数(-XX:FieldsAllocationStyle参数)和字段在Java源码中定义顺序的影响。
HotSpot虚拟机默认的分配顺序为 longs/doubles、ints、shorts/chars、bytes/booleans、oops(Ordinary Object Pointers,OOPs)
2.3 对齐填充
对齐填充(Padding)无特别含义,仅起到占位符作用。
HotSpot虚拟机的自动内存管理系统要求对象起始地址必须是8字节的整数倍。对象头部分已经被精心设计成正好是8字节的倍数(1倍或者
2倍),如果对象实例数据部分没有对齐的话,就需要通过对齐填充来补全。
三、对象的访问定位
规范中没有对访问方式进行定义,因此访问方式可有虚拟机自己实现而定。
主流的访问方式有两种:使用 句柄 和使用 直接指针
3.1 句柄访问
Java堆中划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自具体的地址信息
优势:reference中存储的是稳定句柄地址,在对象被移动(垃圾收集时移动对象是非常普遍的行为)时只会改变句柄中的实例数据指针,而 reference本身不需要被修改。
3.2 直接指针访问
Java堆中对象的内存布局必须考虑如何放置访问类型数据的相关信息,reference中存储的直接就是对象地址,如果只是访问对象本身的话,就不需要多一次间接访问的开销
优势:速度更快,它节省了一次指针定位的时间开销。
注意:HotSpot主要使用直接指针的方式访问对象(有例外情况,如果使用了Shenandoah收集器的话也会有一次额外的转发)