JVM内存管理机制

290 阅读12分钟

1、内存管理机制

JVM有自动内存管理机制,不需要人为地给每一个new操作写配对的delete/free代码,不容易出现内存泄漏和内存溢出问题。然而一旦出现内存泄漏和溢出方面的问题,如果不清楚JVM内存的内存管理机制,将很难定位与解决问题。

image.png

  • 线程私有数据区包含:程序计数器、虚拟机栈、本地方法栈
  • 线程共享数据区包含:Java堆、方法区(内部包含常量池、直接内存

程序计数器

当前线程所执行的字节码的行好指示器,一个线程一个,线程私有。

  • 如果线程正在执行一个java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址,如果执行的是Native方法,这个计数器值为空。

Java虚拟机栈

线程私有,生命周期和线程一样。虚拟机栈描述的是java方法执行的内存模式:每个方法被执行都会创建一个栈帧用于存储局部变量表、操作栈、动态链接、方法出口等信息。

  • 每一个方法被调用直到被执行完成的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程
  • 如果线程请求的栈深度大于虚拟机所允许的深度,将会抛出StatckOverflowError异常。如果虚拟机栈可以动态扩展,当扩展时无法申请到足够的内存时会抛出OutOfMemoryError异常

本地方法栈

与虚拟机栈的作用相似,虚拟机栈为虚拟机执行java方法服务,本地方法栈则是为虚拟机使用Native方法服务。

  • 也会抛出StatckOverflowError和OutOfMemoryError异常

java堆

所有线程共享的一块内存区域(最大),虚拟机启动的创建。存放对象实例,为对象实例分配内存。

  • 是垃圾收集器管理的主要区域,也被称做“GC堆”。
  • 可处于物理上不连续的内存空间中,只要逻辑上是连续的即可。
  • 如果在堆没有内存完成实例分配,并且堆也无法再扩展,将会抛出OutOfMemoryError异常

方法区

所有线程共享的一块内存区域,用于存储已被虚拟机加载的类信息、常量、静态变量、编译器编译后的代码等数据

  • 和Java堆一样不需要连续的内存和可以选择固定大小或可扩展外,还可选择不实现GC。
  • 当方法区无法满足内存分配需求时,将会抛出OutOfMemoryError异常

运行时常量池

Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池(Constant Pool Table),用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。

  • 相对于Class文件常量池的一个重要特征是具备动态性,体现在并非只有预置入Class文件中常量池的内容才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中。
  • 是方法区的一部分,会受到方法区内存的限制。
  • 在Java虚拟机规范中,当常量池无法再申请到内存时会抛出OutOfMemoryError异常。

直接内存

直接内存也称堆外内存,它不是虚拟机运行时数据区的一部分。JDK1.4后引入NIO类,是一种基于通道(Channel)与缓冲区(Buffer)的I/O方式,它可以使用Native函数库直接在堆外分配内存,然后通过存储在Java堆中的DirectByteBuffer对象作为引用对这块内存进行操作。这样能够显著提高性能,避免Java堆和Native堆中来回复制数据。

对象访问

主流的两种访问方式

通过句柄访问对象

在Java堆中划分出一块内存来作为句柄池,reference存储的是对象的句柄地址,在句柄中包含了对象实例数据与类型数据各自的具体地址信息。好处:reference中存储的是稳定的句柄地址,在对象被移动时只会改变句柄中的实例数据指针,而reference本身不需要修改。

句柄访问对象

通过直接指针访问对象

在Java堆对象的布局中考虑如何放置访问类型数据的相关信息,reference存储的直接就是对象地址。好处:速度更快,节省了一次指针定位的时间开销。

直接指针访问对象

2、Java对象的生命周期

创建阶段(Created)

  • 为对象分配存储空间
  • 构造对象
  • 初始化(static成员到非static成员,超类到子类)

应用阶段(In Use)

  • 对象至少被一个强引用持有着。

不可见阶段(Invisible)

  • 程序本身不再持有该对象的不论什么强引用
  • 这些引用仍然存在
  • 程序的运行已经超出了该对象的作用域。

不可达阶段(Unreachable)

  • 程序本身不再持有该对象的不论什么强引用
  • 该对象仍可能被JVM等系统下的某些已装载的静态变量或线程或JNI等强引用持有着(GC root)

收集阶段(Collected)

  • 垃圾回收器已经对该对象的内存空间又一次分配做好准备时

3、判断Java中对象存活

根搜索方法

根搜索方法是通过一些“GCRoots”对象作为起点,从这些节点开始往下搜索,搜索通过的路径成为引用链(ReferenceChain),当一个对象没有被GCRoots的引用链连接的时候,说明这个对象是不可用的。

GCRoots对象包括:

  • 虚拟机栈(栈帧中的本地变量表)中的引用的对象。
  • 方法区域中的类静态属性引用的对象。
  • 方法区域中常量引用的对象。
  • 本地方法栈中JNI(Native方法)的引用的对象。

image.png

4、JVM垃圾回收算法

复制算法

复制算法将可用内存按容量划分为大小相等的两块,每次只使用其中一块。当一块内存用完了,将存活的对象复制到另一块上面,然后把已使用的内存空间一次清理掉。这样使得每次都是对整个半区进行内存回收,内存分配时也就不用考虑内存碎片等情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。只是这种算法将内存缩小为原来的一半,代价较高。

image.png

标记-清除算法

算法分为"标记"和"清除"两个阶段:首先标记出需要回收的对象,在标记完成后统一回收被标记的对象。它主要不足有两个:一是效率问题,标记和清除两个过程效率都不高。二是空间问题,标记清除后会产生大量不连续内存碎片,碎片太多可能导致要分配较大对象时,无法找到足够的内存空间不得不提前触发一次垃圾收集动作。

image.png

标记-整理算法

标记过程与"标记-清除"算法一样,但后续不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存

image.png

分代收集算法

商业虚拟机的垃圾收集都采用分代收集算法,根据对象存活周期将内存划分为几块。Java堆分为新生代和老年代,这样可以根据年代特点采用适当的收集算法。新生代中每次垃圾收集都有大批对象死去,那就选用复制算法。老年代对象存活率高,没有额外空间进行分配担保,适合使用"标记-清理"或"标记-整理"算法来回收。

5、垃圾回收器

通常虚拟机中往往不止有一种GC收集器,下图展示的是HotSpot虚拟机中存在的七种作用于不同分代(新生代、老年代)的收集器,其中被连线的两个收集器表示可以搭配使用。

image.png

各垃圾回收器区别对比:

image.png

具体可参考:www.jianshu.com/p/114bf4d9e…

6、内存分配与回收策略

image.png

可以看到整个内存分为三个区域:新生代,老年代,永久代。

不同的对象的生命周期是不一样的,因此,不同生命周期的对象可以采取不同的回收算法,以便提高回收效率。

年轻代(Young Generation)

  • 所有新生成的对象首先都是放在年轻代的。
  • 新生代中每次垃圾收集都有大批对象死去,那就选用复制算法。
  • 新生代内存按照8:1:1的比例分为一个eden区和两个survivor(survivor0,survivor1)区。
  • 新生代发生的GC也叫做Minor GC,MinorGC发生频率比较高(不一定等Eden区满了才触发)

年老代(Old Generation)

  • 在年轻代中经历了N次垃圾回收后仍然存活的对象,就会被放到年老代中。
  • 内存比新生代也大很多(大概比例是1:2)
  • 当老年代内存满时触发Major GC即Full GC,Full GC发生频率比较低
  • 老年代对象存活时间比较长,存活率标记高,因此适合使用"标记-清理"或"标记-整理"算法来回收。

持久代(Permanent Generation)

  • 用于存放静态文件,如Java类、方法等。
  • 持久代对垃圾回收没有显著影响

内存对象的处理过程

  1. 大部分对象在Eden区中生成。
  2. 回收时先将eden区存活对象复制到一个survivor0区,然后清空eden区
  3. 当这个survivor0区也存放满了时,则将eden区和survivor0区存活对象复制到另一个survivor1区,然后清空eden和这个survivor0区,此时survivor0区是空的,然后将survivor0区和survivor1区交换,即保持survivor1区为空, 如此往复。
  4. 当步骤3达到一定次数,当survivor1区不足以存放 eden和survivor0的存活对象时,就将存活对象直接存放到老年代。若是老年代也满了就会触发一次Full GC,也就是新生代、老年代都进行回收
  5. 当对象在老年代区域停留的世界达到一定程度,该对象会移动到持久代。持久代也会存放一些静态文件。

补充

当Survivor空间不够用时,需要依赖其他内存(这里指老年代)进行分配担保(Handle Promotion)。

空间分配担保:

在Minor GC前,虚拟机会检查老年代最大可用连续空间是否大于新生代所有对象总空间,如果条件成立,那么Minor GC是成立的。如果不成立,虚拟机查看HandlePromotionFailure设置值是否允许担保失败。如果允许,那么会继续检查老年代最大可用连续空间是否大于历次移动到老年代对象的平均大小,如果大于,将尝试一次Minor GC。如果小于,或者HandlePromotionFailure设置值不允许冒险,那将进行一次Full GC。

对象从年轻代进入老年代时机

1、对象优先在Eden分区:

大多数情况下,对象在新生代Eden区中分配。当Eden区没有足够空间分配时,虚拟机发起一次Minor GC。GC后对象尝试放入Survivor空间,如果Survivor空间无法放入对象时,只能通过空间分配担保机制提前转移到老年代。

2、大对象直接进入老年代:

大对象指需要大量连续内存空间的Java对象。虚拟机提供-XX:PretenureSizeThreshold参数,如果大于这个设置值对象则直接分配在老年代。这样可以避免新生代中的Eden区及两个Survivor区发生大量内存复制。

3、长期存活的对象进入老年代:

虚拟机会给每个对象定义一个对象年龄计数器。如果对象在Eden出生并且经过一次Minor GC后任然存活,且能够被Survivor容纳,将被移动到Survivor空间中,并且对象年龄设为1.每次Minor GC后对象任然存活在Survivor区中,年龄就加一,当年龄到达-XX:MaxTenuringThreshold参数设定的值时,将会移动到老年代。

4、动态年龄判断:

虚拟机不是永远要求对象的年龄必须达到-XX:MaxTenuringThreshold设定的值才会将对象移动到老年代去。如果Survivor中相同年龄所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象可以直接进入老年代。

7、GC的执行机制

GC有两种类型:Scavenge GC和Full GC。

Scavenge GC

一般情况下,当新对象生成,并且在Eden申请空间失败时,就会触发Scavenge GC,对Eden区域进行GC,清除非存活对象,并且把尚且存活的对象移动到Survivor区。操作频繁,速度快

Full GC

Full GC因为需要对整个堆进行回收,所以比Scavenge GC要慢,因此应该尽可能减少Full GC的次数。

可能导致Full GC的原因

  • 年老代空间不足 1)分配足够大空间给old gen。 2)避免直接创建过大对象或者数组,否则会绕过年轻代直接进入年老代。 3)应该使对象尽量在年轻代就被回收,或待得时间尽量久,避免过早的把对象移进年老代。

  • 方法区的永久代空间不足 1)分配足够大空间给。 2)避免创建过多的静态对象。

  • 被显示调用System.gc() 通常情况下不要显示地触发GC,让JVM根据自己的机制实现。

  • 上一次GC之后Heap的各域分配策略动态变化

参考:

周志明老师的《深入理解Java虚拟机》

《android应用性能优化最佳实践》

www.jianshu.com/p/a9ff88233…

www.cnblogs.com/andy-zcx/p/…

www.cnblogs.com/fefjay/p/62…

www.jianshu.com/p/a62697f00…

www.jianshu.com/p/b4a03b5de…

www.jianshu.com/p/114bf4d9e…

www.cnblogs.com/mengfanrong…