JVM笔记:java堆

61 阅读13分钟

简介

在java应用程序中,java堆 是虚拟机所管理的内存职工最大的一块,java堆是被所有线程共享的一块内存区域,在虚拟机启动时就会创建堆。 java堆的唯一目的就是存放对象实例和数组,几乎所有对象实例和数组都在这里分配内存。

java堆是垃圾收集器管理的内存区域。Java堆可以处于物理上不连续的内存空间中,但在逻辑上它应该被视为连续的。

堆内存划分

现代垃圾收集器大部分都基于分代收集理论设计,堆空间在java7 和java8有不同的划分方式。

Java 7及之前堆内存逻辑上分为三部分:新生代+养老代+永久代

Young Generation Space 新生代 Young/New 又被划分为1个Eden区和2个Survivor区

Tenure generation space 老年代 Old/Tenure

Permanent Space 永久代 Perm

Java8及之后堆内存逻辑上分为三部分:新生代+老年代+元空间 Young Generation Space 新生代 Young/New 又被划分为1个Eden区和2个Survivor区 Tenure generation space 老年代 0ld/Tenure

Meta Space 元空间 Meta

堆空间的结构图如下: 在这里插入图片描述 在这里插入图片描述 通过JVisualVM的插件VisualVMGC 查看的内存情况;

public class SimpleHeap {
    private int id;

    public  SimpleHeap(int id){
        this.id=id;
    }

    public  void show(){
        System.out.println("My ID is "+ id);
    }

    public static void main(String[] args) {
        SimpleHeap s1 = new SimpleHeap(1);
        SimpleHeap s2 = new SimpleHeap(2);

        int[]  arr= new int[10];

        Object[] arr1 = new Object[10];
      

    }
}

以上述代码为例,为了方便查看,在代码中加入死循环代码,结果如下图: 在这里插入图片描述

新生代和老年代

存储在JVM中的Java对象可以被划分为两类:

  • 一类是生命周期较短的瞬时对象,这类对象的创建和消亡都非常迅速
  • 一类对象的生命周期却非常长,在某些极端的情况下还能够与JVM的生命周期保持一致。

Java堆区进一步细分的话,可以划分为新生代(YoungGen)和老年代(oldGen) 其中新生代又可以划分为Eden空间、Survivor0空间和Survivor1空间(有时也叫做 from区、to区)。

在这里插入图片描述

在开发中,一般不会对堆的新生代和老年代的参数进行调整.配置新生代与老年代在堆结构的占比。默认-XX:NewRatio=2,表示新生代占1,老年代占2, 新生代占整个堆的1/3。可以修改-XX:NewRatio=4,表示新生代占1,老年代占4,新生代占整个堆的1/5在HotSpot中,Eden空间和另外两个Survivor空间缺省所占的比例是8:1:1。当然开发人员可以通过选项“-xx:SurvivorRatio”调整这个空间比例。比如-XX:SurvivorRatio=8。

几乎所有的Java对象都是在Eden区被new出来的。绝大部分的Java对象的销毁都在新生代进行了。但IBM公司的专门研究表明,新生代中80%的对象都是“朝生夕死”的。可以使用选项"-Xmn"设置新生代最大内存大小,无特殊情况,这个参数一般使用默认值就可以了。

设置堆空间大小

Java堆区用于存储Java对象实例,那么堆的大小在JVM启动时就已经设定好了,大家可以通过选项"-Xmx和“-Xms“来进行设置。

“-Xms”用于表示堆区的起始内存,等价于-XX:InitialHeapSize

“-Xmx”则用于表示堆区的最大内存,等价于-XX:MaxHeapSize

一但堆区中的内存大小超过“-Xmx"所指定的最大内存时,将会抛出 OutofMemoryError异常。

通常会将-Xms和-Xmx两个参数配置相同的值,其目的是为了能够在iava垃圾回收机制清理完堆区后不需要重新分隔计算堆区的大小,从而提高性能。

默认情况下:

  • 初始内存大小:物理电脑内存大小/64
  • 最大内存大小:物理电脑内存大小/4

堆空间的参数设置

-XX:PrintFlagsInitial:查看所有的参数的默认初始值

-xx:+PrintFlagsFinal:查看所有的参数的最终值(可能会存在修改,不再是初始值)

-Xms:初始堆空间内存 (默认为物理内存的1/64)

Xmx:最大堆空间内存(默认为物理内存的1/4)

-Xmn:设置新生代的大小。(初始值及最大值)

-XX:NewRatio:配置新生代与老年代在堆结构的占比

在发生Minor GC之前,虚拟机会检查老年代最大可用的连续空间是否大于新生代所有对象的总空间。

  • 如果大于,则此次Minor GC是安全的
  • 如果小于,则虚拟机会查看-XX:HandlePromotionFailure设置值是否允许担保失败。
    • 如果HandlePromotionFailure=true,那么会继续检查老年代最大可用连续空间是否大于历次晋升到老年代的对象的平均大小。
      • 如果大于,则尝试进行一次MinorGC,但这次MinorGC依然是有风险的;
      • 如果小于,则改为进行一次Full GC。
    • 如果HandlePromotionFailure=false,则改为进行一次Full GC。

在JDK6 Update24(jdk7 )之后,HandlePromotionFailure参数不会再影响到虚拟机的空间分配担保策略,观察OpenJDK中的源码变化,虽然源码中还定义了HandlePromotionFailure参数,但是在代码中已经不会再使用它。

JDK6 Update24之后的规则变为只要老年代的连续空间大于新生代对象总大小或者历次晋升的平均大小就会进行Minor Gc,否则将进行Full GC。

堆空间的垃圾回收

JVM在进行GC时,并非每次都对上面三个内存区域一起回收的,大部分时候回收的都是指新生代。

回收类型划分

针对HotSpot VM的实现,它里面的GC按照回收区域又分为两大种类型;一种是部分收集(Partial GC),一种是整堆收集(Full GC)。

部分收集(Partial GC)

部分收集(Partial GC) 是指目标不是完整收集整个java堆的垃圾收集,其中又可以分为:

  • 新生代收集(Minor GC/Young GC):指目标只是新生代的垃圾收集。
  • 老年代收集(Major GC/Old GC): 指目标只是老年代的垃圾收集。目前只有CMS 收集器会有单独收集老年代的行为。
  • 混合收集(Mixed GC):指目标是收集整个新生代以及部分老年代的垃圾收集,目前只有G1收集器会有这种行为。

整堆收集(Full GC)

整堆收集(Full GC) 是指收集整个java堆和方法区的垃圾收集。

新生代GC(Minor GC) 触发机制

当年轻代空间不足时,就会触发MinorGC,这里的年轻代满指的是Eden代满,Survivor满不会引发GC。

因为Java 对象大多都具备朝生夕灭的特性,所以 Minor GC 非常频 繁,一般回收速度也比较快。

Minor GC会引发STW,暂停其它用户的线程,等垃圾回收结束,用户线程才恢复运行。

在这里插入图片描述

老年代GC(Major GC)触发机制

老年代GC是指发生在老年代的GC,对象从老年代消失时,Major GC就会发生。出现了MaiorGC,经常会伴随至少一次的MinorGC(但非绝对的,在Parallel Scavenge收集器的收集策略里就有直接进行MajorGC的策略选择过程)。在老年代空间不足时,会先尝试触发Minor GC。如果之后空间还不足,则触发Major GC。Major GC的速度一般会比MinorGC慢10倍以上,STW的时间更长。如果Major GC后,内存还不足,就报OOM了。

Full GC 触发机制

触发FullGC执行的情况有如下五种: (1)调用Svstem.gc()时,系统建议执行Full GC,但是不必然执行

(2)老年代空间不足

(3)方法区空间不足

(4)通过MinorGC后进入老年代的平均大小大于老年代的可用内存

(5)由Eden区、survivor space0(From Space)区向survivor space1(To Space)区复制时,对象大小大于ToSpace可用内存,则把该对象转存到老年代,且老年代的可用内存小于该对象大小

FULL AC是开发或调优中尽量要避免的。这样暂时时间会短一些。

内存分配策略

如果对象在Eden出生并经过第一次MinorGC后仍然存活,并且能被Survivor容纳的话,将被移动到Survivor 空间中, 并将对象年龄设为1。对象在Survyivor区中每熬过一次MinorGC,年龄就增加1岁,当它的年龄增加到一定程度(默认为15岁,其实每个JVM、每个GC都有所不同)时,就会被晋升到老年代中。对象晋升老年代的年龄阈值,可以通过选项-XX:MaxTenuringThreshold来设置。

针对不同年龄段的对象分配原则如下所示:

  • 优先分配到Eden
  • 大对象直接分配到老年代
    • 尽量避免程序中出现过多的大对象
  • 长期存活的对象分配到老年代
  • 动态对象年龄判断
    • 如果Survivor区中相同年龄的所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象可以直接进入老年代,无须等到 MaxTenuringThreshold 中要求的年龄。
  • 空间分配担保
    • -XX:HandlePromotionFailure

逃逸分析

如何将堆上的对象分配到栈,需要使用逃逸分析手段。这是一种可以有效减少Java程序中同步负载和内存堆分配压力的跨函数全局数据流分析算法。通过逃逸分析,Java Hotspot编译器能够分析出一个新的对象的引用的使用范围从而决定是否要将这个对象分配到堆上。

逃逸分析的基本行为就是分析对象动态作用域:

  • 当一个对象在方法中被定义后,对象只在方法内部使用,则认为没有发生逃逸。
  • 当一个对象在方法中被定义后,它被外部方法所引用,则认为发生逃逸。例如作为调用参数传递到其他地方中。

没有发生逃逸的对象,则可以分配到栈上,随着方法执行的结束,栈空间就被移除.

使用逃逸分析,编译器可以对代码做如下优化: (1)栈上分配。 将堆分配转化为栈分配。如果一个对象在子程序中被分配,要使指向该对象的指针永远不会逃逸,对象可能是栈分配的候选,而不是堆分配。

JIT编译器在编译期间根据逃逸分析的结果,发现如果一个对象并没有逃逸出方法的话,就可能被优化成栈上分配。分配完成后,继续在调用栈内执行,最后线程结束,栈空间被回收,局部变量对象也被回收。这样就无须进行垃圾回收了。

常见的栈上分配的场景:在逃逸分析中,已经说明了。分别是给成员变量赋值、方法返回值、实例引用传递。

(2)同步省略(消除)

如果一个对象被发现只能从一个线程被访问到,那么对于这个对象的操作可以不考虑同步。线程同步的代价是相当高的,同步的后果是降低并发性和性能。

在动态编译同步块的时候,JIT编译器可以借助逃逸分析来判断同步块所使用的锁对象是否只能够被一个线程访问而没有被发布到其他线程。如果没有,那么JIT编译器在编译这个同步块的时候就会取消对这部分代码的同步。这样就能大大提高并发性和性能。这个取消同步的过程就叫同步省略,也叫锁消除。

如以下代码:

public void f() {
    Object hollis = new object(); 
    synchronized(hollis) {
        System.out.println(hollis);
    }
}

代码中对hollis这个对象进行加锁,但是hollis对象的生命周期只在f()方法中,并不会被其他线程所访问到,所以在JIT编译阶段就会被优化掉。优化成:

public void f() {
    Obiect hollis = new obiect(); System.out.println(hollis);
}

(3)分离对象或标量替换 有的对象可能不需要作为一个连续的内存结构存在也可以被访问到,那么对象的部分(或全部)可以不存储在内存,而是存储在CPU寄存器中。标量(Scalar)是指一个无法再分解成更小的数据的数据。Java中的原始数据类型就是标量。相对的,那些还可以分解的数据叫做聚合量(Aggregate),Java中的对象就是聚合量,因为他可以分解成其他聚合量和标量。

在JIT阶段,如果经过逃逸分析,发现一个对象不会被外界访问的话,那么经过JIT优化,就会把这个对象拆解成若干个其中包含的若干个成员变量来代替。这个过程就是标量替换。

public static void main(string[] arqs) {
    alloc();
}
private static void alloc() {
    Point point = new Point (1,2)
    system.out.println("point.x="+point.x+"; point.y="+point.y); 
}

class Point{
    private int x ;
    private int y;
}

以上代码,经过标量替换后,就会变成:

private static void alloc() {
    int x = 1; int y = 2;
    System.out.println ("point.x="+x+"; point.y="+y);
}

可以看到,Point这个聚合量经过逃逸分析后,发现他并没有逃逸,就被替换成两个聚合量了。那么标量替换有什么好处呢?就是可以大大减少堆内存的占用。因为一日不需要创建对象了,那么就不再需要分配堆内存了。

标量替换为栈上分配提供了很好的基础。标量替换参数设置:参数FXX:+EliminateAllocations:开启了标量替换(默认打开),允许将对象打散分配在栈上。

上述代码在主函数中进行了1亿次alloc。调用进行对象创建,由于User对象实例需要占据约16字节的空间,因此累计分配空间达到将近1.5GB。如果堆空间小于这个值,就必然会发生 GC。使用如下参数运行上述代码:

-server -Xmx100m -Xms100m -xx:+DoEscapeAnalysis Xx:+PrintGC -xx:+EliminateAllGcations

参数说明:

  • 参数-server:启动Server模式,因为在Server模式下,才可以启用逃逸分析。
  • 参数-XX:+DoEscapeAnalysis:启用逃逸分析参数
  • -Xmx10m:指定了堆空间最大为10MB
  • 参数-Xx:+PrintGC:将打印GC 日志。
  • 参数-XX:+EliminateAllocations:开启了标量替换(默认打开),允许将对象打散分配在栈上,比如对象拥有id和name两个字段,那么这两个字段将会被视为两个独立的局部变量进行分配。

总结

年轻代是对象的诞生、成长、消亡的区域,一个对象在这里产生、应用,最后被垃圾回收器收集、结束生命。

老年代放置长生命周期的对象,通常都是从Survivor区域筛选拷贝过来的 Java对象。当然,也有特殊情况,我们知道普通的对象会被分配在TLAB上如果对象较大,JVM会试图直接分配在Eden其他位置上;如果对象太大,完全无法在新生代找到足够长的连续空闲空间,JVM就会直接分配到老年代.

当GC只发生在年轻代中,回收年轻代对象的行为被称为MinorGC。当GC发生在老年代时则被称为MajorGC或者FullGC。一般的,MinorGC的发生频率要比MajorGC高很多,即老年代中垃圾回收发生的频率将大大低于年轻代。