JVM内存区域划分
● 程序计数器(Program Counter Register):是一块较小的内存空间,它可以看成是当前线程所执行的字节码的行号指示器。每条线程都需要一个独立的程序计数器,各条线程之间计数器互不影响,独立存储。该内存区域是唯一一个在java虚拟机规范中没有规定任何OutOfMemoryError情况的区域。
● java虚拟机栈(Stack):和程序计数器一样是线程私有的,它的生命周期和线程相同。每个方法在执行的同时会创建一个栈帧用于存储局部变量表、操作数栈、动态链接、方法出口等信息。局部变量表存放了编译期可知的各种基本数据类型(int/short/float/long/double/boolean/char/byte)、对象引用。如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverfolwError异常,如果虚拟机允许动态扩展,但无法申请到足够的内存,将抛出OutOfMemeroyError异常。
● 本地方法栈(Native Method Stack):和虚拟机栈类似,本地方法栈用于执行Native方法。
● java堆(Heap):java堆是被所有线程共享的内存区域,几乎所有的对象实例和数组都要在堆上分配
● 方法区(Method Area):和堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类型信息、常量、静态变量、即时编译器编译后的代码缓存等数据。对于一个Class文件,除了版本、字段、方法、接口等描述信息外,还有常量池表,主要用于编译器生成的各种字面量和符号引用,而这部分内容在Class文件加载后是存放在方法区的运行时常量池中。这个运行时常量池自然还包括了字符串常量池。但需要注意的是,在JDK 7以后的版本中,字符串常量池等被移至到了Java堆区,而到了JDK 8,抛弃了之前永久代的概念,通过在本地内存中实现了元空间(Metaspace)来代替永久代,并把JDK 7中永久代剩余内容(主要是类型信息)全部移至到了元空间。
● 元空间(Metaspace):永久代是Hotspot对于JVM方法区规范的实现。在JDK1.8中,Hotspot已经没有永久代这个区间了,取而代之的是元空间。元空间的本质和永久代类似,都是对JVM规范中方法区的实现,不过元空间与永久代之间最大的区别在于:元空间并不在虚拟机中,而是使用本地内存。因此,默认情况下,元空间的大小仅受本地内存限制。
● 直接内存(Direct Memory):直接内存并不是虚拟机运行时数据区的一部分,也不是java虚拟机规范中定义的内存区域。但是这部分内存也被频繁使用,而且也可能导致OutOfMemoryError异常出现。在JDK1.4中新加入了NIO类,引入了一种基于通道(Channel)与缓冲区(Buffer)的I/O方式,它可以使用Native函数库直接分配堆外内存,然后通过一个存储在Java堆中的DirectByteBuffer对象作为作为这块内存的引用进行操作。这样能在一些场景中显著提高性能,因为避免了在Java堆和Native堆中来回复制数据。
堆内存中的Minor GC和Full GC
图中括号里内存数字表示最大可分配内存,实际分配内存,括号外的表示当前占用内存
● 新生代GC(Minor GC):指发生在新生代的垃圾收集动作,因为Java对象大多都具备朝生夕死的特性,所以Minor GC非常频繁,一般回收速度也比较快
● 老年代GC(Major GC / Full GC):指发生在老年代的GC,出现了Major GC,经常会伴随着至少一次的Minor GC(但非绝对的,在Parallel Scavenge收集器的收集策略里就有直接进行Major GC的策略选择过程)。Major GC的速度一般会比Minor GC慢10倍以上
堆内存默认分配规则
默认的,新生代 ( Young ) 与老年代 ( Old ) 的比例的值为 1:2 ( 该值可以通过参数 –XX:NewRatio 来指定 ),即:新生代 ( Young ) = 1/3 的堆空间大小。老年代 ( Old ) = 2/3 的堆空间大小。
其中,新生代 ( Young ) 被细分为 Eden 和 两个 Survivor 区域,这两个 Survivor 区域分别被命名为 from 和 to,以示区分。默认的,Eden : from : to = 8 : 1 : 1 ( 可以通过参数 –XX:SurvivorRatio 来设定 ),即: Eden = 8/10 的新生代空间大小,from = to = 1/10 的新生代空间大小。
垃圾收集算法
● 标记-清除算法:首先标记出所有需要回收的对象,在标记完成后统一回收被标记的对象。不足之处在于 1、效率问题,标记和清除的两个过程效率都不太高 2、空间问题 标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。
● 复制算法:将可用内存按容量划分为等量的两块,每次只使用其中的一块。当这一块内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。这种算法现在大多用来清理新生代。由于新生代朝生夕死,所以将内存分为一个较大的Eden区域和两块较小的Survivor区域,当回收时,将Eden和Survivor上存活的对象复制到另一块Survivor中,然后清理Eden和Survivor,当Survivor空间不足时,需要将某些新生代通过分配担保机制进入老年代。
● 标记-整理算法:类似于标记清除算法,标记完成后将所有存活的对象向一端移动,然后直接清理掉端边界以外的内存。
● 分代收集算法:将对象分为新生代和老年代,在新生代中,每次垃圾收集时都有大批对象死去,就选用复制算法。而老年代中因为对象存活率高,没有额外空间对它进行分配担保,就必须使用标记清理或标记整理算法进行回收。
堆内存分配与回收策略
● 对象优先在Eden分配:大多数情况下,对象在新生代Eden区中分配。当Eden区没有足够空间进行分配时,虚拟机将发起一次Minor GC
● 大对象直接进入老年代:所谓的大对象是指,需要大量连续内存的空间对象,最典型的就是那种很长的字符串以及数组
● 长期存活的对象将进入老年代:既然虚拟机采用了分代收集的思想来管理内存,那么内存回收时就必须能识别哪些对象应放在新生代,哪些对象应放在老年代中。为了做到这点,虚拟机给每个对象定义了一个对象年龄(Age)计数器。如果对象在Eden出生并经过第一次Minor GC后仍然存活,并且能被Survivor容纳的话,将被移动到Survivor空间中,并且对象年龄设为1。对象在Survivor区中每熬过一次Minor GC,年龄就增加1岁,当它的年龄增加到一定程度(默认为15岁),就将被晋升到老年代中
● 动态对象年龄判断:为了能更好地适应不同程序的内存状况,虚拟机并不是永远地要求对象的年龄必须达到了MaxTenuringThreshold才能晋升老年代,如果在Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半,年龄大于等于该年龄的对象就可以直接进入老年代
● 空间分配担保:在发生Minor GC之前,虚拟机会检查老年代最大可用的连续空间是否大于新生代所有对象总空间,如果这个条件成立,那么Minor GC可以确保是安全的。如果不成立,则虚拟机会查看HandlePromotionFailure设置值是否允许担保失败。如果允许,那么会继续检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小,如果大于,将尝试着进行一次Minor GC,尽管这次Minor GC是有风险的;如果小于,或者HandlePromotionFailure设置不允许冒险,那这时也要改为进行一次Full GC。在JDK 6 Update 24之后,HandlePromotionFailure参数在代码中已经不会再使用它,规则变为只要老年代的连续空间大于新生代对象总大小或者历次晋升的平均大小就会进行Minor GC,否则将进行Full GC
常量池
class文件常量池(Class Constant Pool)
通过javap -v命令反编译.class文件,可以看到其中一项叫Constant Pool,用于存放编译期间生产的各种字面量和符号引用
运行时常量池(Runtime Constant Pool)
运行时常量池(Runtime Constant Pool)是方法区的一部分。对于运行时常量池,Java虚拟机规范没有做任何细节的要求,不同的提供商实现的虚拟机可以按照自己的需要来实现这个内存区域。虚拟机启动过程中,会将各个Class文件中的常量池载入到运行时常量池中。
字符串常量池(String Pool)
字符串常量池,是JVM用来维护字符串实例的一个引用表。字符串常量池在逻辑上属于方法区,但JDK1.7开始,就被挪到了堆区。在HotSpot虚拟机中,它被实现为一个全局的StringTable,底层是一个c++的hashtable。它将字符串的字面量(也就是值)作为key,实际堆中创建的String对象的引用作为value。
String的字面量被导入JVM的运行时常量池时,并不会马上在字符串常量池加入对应String的引用,而是等到程序实际运行时,要用到这个字面量对应的String对象时,才会去字符串常量池试图获取或者加入String对象的引用。因此它是懒加载的。
String s = new String("hello world");
System.out.println(s == "hello world");
如果“hello world”是首次被执行,则会创建两个String对象。一个是JVM拿到字面量“hello world”去字符串常量池中获取String对象的引用,此时由于第一次执行,找不到引用,会在堆中创建一个String对象,然后把这个引用保存在字符串常量池中并返回。因为使用new String的方式,此时堆中会创建一个与“hello world”等值的String对象,然后返回。此时存在两个对象值都是“hello world”但是引用不同(指向不同的内存地址),因此此时两个引用指向的不相同,输出false。
如果“hello world”不是首次被执行,则会创建一个对象。JVM拿到字面量“hello world”去字符串常量池中获取String对象的引用,由于之前创建过,因此直接返回引用即可。但是因为使用new String的方式,此时堆中还是会创建一个与“hello world”等值的String对象,然后返回。此时存在新创建的对象值也是“hello world”,但是与字符串常量池中“hello world”字面量的引用不同(指向不同的内存地址),因此此时两个引用指向的不相同,也是输出false。
更多的例子:
// jdk 1.8
String s1 = "hello"; // s1指向字符串常量池
String s2 = new String("hello"); // s2指向堆
System.out.println(s1 == s2); // false
String s3 = s2.intern(); // Jdk7执行intern操作时,如果常量池已经存在该字符串,则直接返回字符串引用
System.out.println(s3 == s1); // true
System.out.println(s3 == s2); // false
String h1 = "world";
String h2 = h1.intern();
System.out.println(h1 == h2); // true
String s4 = "hel" + "lo"; // 编译器直接编译成 String s4 = "hello";
String s5 = "hello";
System.out.println(s4 == s1); // true
System.out.println(s5 == s1); // true
String s6 = "hel";
String s7 = "lo";
String s8 = s6 + s7; // 编译器其实执行的是 StringBuilder.append StringBuilder.toString 等于new String
System.out.println(s8 == s1); // false
封装类常量池
除了字符串常量池,Java的基本类型的封装类大部分也都实现了常量池。包括Byte,Short,Integer,Long,Character,Boolean,注意,浮点数据类型Float,Double是没有常量池的。
要注意的是,这些常量池是有范围的:
- Byte,Short,Integer,Long : [-128~127]
- Character : [0~127]
- Boolean : [True, False]
例如下面的代码:
Integer i1 = 127;
Integer i2 = 127;
System.out.println(i1 == i2); // true
Integer i3 = 128;
Integer i4 = 128;
System.out.println(i3 == i4); // false
Integer i5 = -128;
Integer i6 = -128;
System.out.println(i5 == i6); // true
Integer i7 = -129;
Integer i8 = -129;
System.out.println(i7 == i8); // false