【Java】JVM学习笔记

370 阅读16分钟

JVM 笔记

参考:狂神说Java

  • 请你谈谈对JVM的理解?java8虚拟机和之前的变化更新?
  • 什么是OOM,什么是栈溢出StackOverFlowError?怎么分析?
  • JVM的常用调优参数有哪些?
  • 内存快照如何抓取,怎么分析Dump文件?
  • 谈谈你对JVM中类加载器的认识?

1. JVM的位置

image.png

三种JVM:

  • Sun公司:HotSpot 用的最多
  • BEA:JRockit
  • IBM:J9VM

2. JVM体系结构

image.png

jvm调优:99%都是在方法区和堆,大部分时间调堆。 JNI(java native interface)本地方法接口

image.png

3. 类加载器

作用:加载Class文件~ 如果new Student();(具体实例在堆里,引用变量名放栈里)

image.png

对于任意一个类,都需要由加载它的类加载器和这个类本身一同确立在 JVM 中的唯一性,每一个类加载器,都有一个独立的类名称空间。类加载器就是根据指定权限名称将 class 文件加载到 JVM 内存,然后再转化为 class 对象。 虚拟机自带的加载器

  • 虚拟机自带的加载器
  • 启动类(根)加载器(BootstrapClassLoader)——程序获取不到 jdk->jre->lib->rt.jar。是虚拟机自身的一部分,用来加载Java_HOME/lib/目录中的,或者被 -Xbootclasspath 参数所指定的路径中并且被虚拟机识别的类库;
  • 扩展类加载器(是应用程序加载类的父类)—— jdk->jre->lib->ext。负责加载\lib\ext目录或Java. ext. dirs系统变量指定的路径中的所有类库;
  • 应用程序加载器——本地实现了ClassLoader,自定义的类加载器。负责加载用户类路径(classpath)上的指定类库,我们可以直接使用这个类加载器。一般情况,如果我们没有自定义类加载器默认就是用这个加载器。 JVM框架-详细

image.png

4.双亲委派机制

image.png

  • 如果一个类加载器收到了类加载的请求,它首先不会自己去加载这个类,而是把这个请求委派给父类加载器去完成,每一层的类加载器都是如此,这样所有的加载请求都会被传送到顶层的启动类加载器中,只有当父加载无法完成加载请求(它的搜索范围中没找到所需的类)时,子加载器才会尝试去加载类。

  • 为了安全

    1. APP->EXC->BOOT(最终执行),就算APP和EXC有,也会网上找,找到了就执行最高级别的
    2. 如果BOOT没有,才去EXC找,EXC没有,才去APP找
    3. 想要执行你想要的跟rt.jar包重名的类,要么修改rt.jar包,要么通过修改类加载器实现
  • 步骤:(核心:向上请求,向下加载

    1. 类加载器收到类加载的请求

    2. 将这个请求向上委托给父类加载器去完成,一直向上委托,直到启动类(根)加载器

    3. 启动类加载器检查是否能够加载当前这个类,能加载就结束,使用当前的加载器,否则,通知子类进行加载。

    4. 重复步骤3,如果应用程序加载器也没有,抛出异常,Class Not Found

    • 本地方法Native涉及到底层调用操作系统的接口问题,即java保留了c的接口,而这些本地方法就是用native修饰的
  • Java早期的名字:C++ - -; Java = C++:去掉繁琐的东西,指针,内存管理~

image.png

5. 沙箱安全机制

  • Java安全模型的核心就是Java沙箱(sandbox) ,

  • 什么是沙箱?

    沙箱是一个限制程序运行的环境。沙箱机制就是将Java代码限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。

  • 沙箱主要限制系统资源访问,那系统资源包括什么? CPU、内存、文件系统、网络。不同级别的沙箱对这些资源访问的限制也可以不一样。

  • 所有的Java程序运行都可以指定沙箱,可以定制安全策略。

1.在Java中将执行程序分成本地代码和远程代码两种,本地代码默认视为可信任的,而远程代码则被看作是不受信的。对于授信的本地代码,可以访问一切本地资源。而对于非授信的远程代码在早期的Java实现中,安全依赖于沙箱Sandbox)机制。如下图所示JDK1.0安全模型

image.png

2.但如此严格的安全机制也给程序的功能扩展带来障碍,比如当用户希望远程代码访问本地系统的文件时候,就无法实现。因此在后续的Java1.1版本中,针对安全机制做了改进,增加了安全策略,允许用户指定代码对本地资源的访问权限。如下图所示JDK1.1安全模型

image.png

3.在Java1.2版本中,再次改进了安全机制,增加了代码签名。不论本地代码或是远程代码,都会按照用户的安全策略设定,由类加载器加载到虚拟机中权限不同的运行空间,来实现差异化的代码执行权限控制。如下图所示

image.png

4.当前最新的安全机制实现(也是现在用的),则引入了域(Domain)的概念。虚拟机会把所有代码加载到不同的系统域和应用域,系统域部分专门负责与关键资源进行交互,而各个应用域部分则通过系统域的部分代理来对各种需要的资源进行访问。虚拟机中不同的受保护域(Protected Domain),对应不一样的权限(Permission)。存在于不同域中的类文件就具有了当前域的全部权限,如下图所示最新的安全模型(jdk 1.6)

image.png

组成沙箱的基本组件

  • 字节码校验器(bytecode verifier):确保Java类文件遵循Java语言规范。这样可以帮助Java程序实现内存保护。但并不是所有的类文件都会经过字节码校验,比如核心类。

  • 类装载器(class loader):其中类装载器在3个方面对Java沙箱起作用

    • 它防止恶意代码去干涉善意的代码;
    • 它守护了被信任的类库边界;
    • 它将代码归入保护域,确定了代码可以进行哪些操作。

虚拟机为不同的类加载器载入的类提供不同的命名空间,命名空间由一系列唯一的名称组成,每一个被装载的类将有一个名字,这个命名空间是由Java虚拟机为每一个类装载器维护的,它们互相之间甚至不可见。

类装载器采用的机制是双亲委派模式。 0. 从最内层JVM自带类加载器开始加载,外层恶意同名类得不到加载从而无法使用; 0. 由于严格通过包来区分了访问域,外层恶意的类通过内置代码也无法获得权限访问到内层类,破坏代码就自然无法生效。

  • 存取控制器(access controller):存取控制器可以控制核心API对操作系统的存取权限,而这个控制的策略设定,可以由用户指定。

  • 安全管理器(security manager):是核心API和操作系统之间的主要接口。实现权限控制,比存取控制器优先级高。

  • 安全软件包(security package):java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性,包括:

    • 安全提供者
    • 消息摘要
    • 数字签名 keytools https(需要证书)
    • 加密
    • 鉴别

6. Native(重点)

native :凡是带了native关键字的,说明java的作用范围达不到了,会去调用底层c语言的库!

Native是核心,能把面试官唬住的东西。 凡是带了native 关键字的方法会进入本地方法栈,其它的是java栈。 核心:

在内存区域中专门开辟了一块标记区域:本地方法栈(Native Method Stack),用来登记标记为native的方法(代码);在(最终执行)执行引擎执行(Execution Engine)的时候通过调用本地方法本地接口 JNI,加载本地方法库(Native Libraies)中的方法

JNI:Java Native Interface(本地方法接口)

调用本地方法接口(JNI)作用:

扩展java的使用,融合不同的编程语言为java所用。java诞生的初衷是融合C/C++程序,C、C++横行,想要立足,必须要有调用C、C++的程序~。

它在内存区城中专门开辟了块标记区城: Native Method Stack

的具体做法是Native Method Stack中登记native方法,在( Execution Engine )执行引擎执行的时候加载Native Libraies。[本地库]

目前该方法使用的越来越少了,除非是与硬件有关的应用,比如通过Java程序驱动打印机或者Java系统管理生产设备,在企业级应用中已经比较少见。因为现在的异构领域间通信很发达,比如可以使用Socket通信,也可以使用Web Service等等,不多做介绍!

7. PC寄存器

程序计数器: Program Counter Register

每个线程都有一个程序计数器,是线程私有的,就是一个指针, 指向方法区中的方法字节码(用来存储指向下一条指令的地址, 也即将要执行的指令代码),在执行引擎读取下一条指令, 是一个非常小的内存空间,几乎可以忽略不计

8. 方法区

Method Area方法区:

image.png

方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区间;

静态变量、常量、类信息(构造方法、接口定义)、运行时的常量池存在方法区中,但是实例变量存在堆内存中,和方法区无关。 如:static,final,,Class(类模板), 常量池

面试题:一张白纸,画出对象实例化过程的内存图。(主要是考你对JVM的理解)

9. 栈

  1. 栈:数据结构
    • 程序=数据结构+算法:持续学习~
    • 程序=框架+业务逻辑:吃饭~
  2. 栈:先进后出、后进先出
    • 桶 队列:先进先出 ( FIFO ):
    • 管 喝多了吐就是栈,吃多了拉就是队列 为什么main() 先执行,最后结束? (因为一开始mian()先压入栈栈帧图:

image.png

栈 + 堆 + 方法区:交互关系

image.png

  • 栈满了: StackOverflowError

10. 堆

Heap:一个JVM只有一个堆内存,堆的大小是可以调节的。

类加载器读取了类文件后,一般会把什么东西放到堆中?

类,方法,常量,变量~,保存所有引用类型的真实对象

堆内存细分3个区域:

  • 新生区(伊甸园区) Young/new
  • 养老区 old
  • 永久区 Perm(JDK8以后在堆中移除了永久代(区),把这个区域移到了本地内存中,即元空间)

image.png

  • GC垃圾回收,主要是在伊甸园区和养老区~
  • 假设内存满了,OOM,堆内存不够! java.lang.OutOfMemoryError:Java heap space
  • 永久存储区里存放的都是Java自带的 例如lang包中的类 如果不存在这些,Java就跑不起来了 在JDK8以后,永久存储区改了个名字(元空间),但在本地内存

新生区、老年区、永久区

新生区(伊甸园+幸存者区*2)

  • 类诞生和成长甚至死亡的地方;
  • 伊甸园,所有对象都是在伊甸园区new出来的!
  • 幸存者区(from, to),轻GC定期清理伊甸园,活下来的放入幸存者区,幸存者区满了之后重GC清理 伊甸园+幸存者区,活下来的放入养老区。都满了就报OOM。

真理:经过研究,99%的对象都是临时对象!直接被清理了

老年区: 新生区剩下来的,轻GC杀不死了。

永久区: 这个区域常驻内存,用来存放JDK自身携带的Class对象,Interface元数据,存储的是java运行时的一些环境或类信息,该区域不存在垃圾回收GC。关闭虚拟机就会释放这个内存。

  • jdk1.6之前:永久代,常量池在方法区
  • jdk1.7:永久代,但是慢慢退化了(去永久代)常量池在堆中
  • jdk1.8之后:无永久代,常量池在元空间

一个启动类,加载了大量的第三方jar包。Tomcat部署了太多的应用,大量动态生成的反射类。不断的被加载。直 到内存满,就会出现OOM。

image.png

方法区又称非堆(non-heap),本质还是堆,只是为了区分概念。

元空间逻辑上存在,物理上并不存在。

补充:

  • 年轻代空间(包括 Eden 和 Survivor 区域)回收内存被称为 Minor GC,对老年代GC称为Major GC,而Full GC是对整个堆来说的
  • 新生代 GC (Minor GC):发生在新生代的垃圾回收动作,频繁,速度快。此时如果新生的对象无法在 Eden 区创建(Eden 区无法容纳) 就会触发一次Young GC,此时会将 S0 区与Eden 区的对象一起进行可达性分析,找出活跃的对象,将它复制到 S1 区并且将S0区域和 Eden 区的对象给清空,这样那些不可达的对象进行清除,并且将S0 区 和 S1区交换

    • 没进行一次MinorGC,就age++,当age>=15时就会进入老年区。
    • Q:为啥会有两个 Survivor 区? A: 因为假设设想一下只有一个 Survibor 区 那么就无法实现对于 S0 区的垃圾收集,以及分代年龄的提升。
  • 老年代 GC (Major GC) :发生在老年代的GC ,基本上发生了一次Major GC 就会发生一次 Minor GC。并且Major GC 的速度往往会比 Minor GC 慢 10 倍。

    • Q:什么时候会触发?

      1. 随后继续尝试在Eden区存放,发现仍然放不下
      2. 尝试直接进入老年代,老年代也放不下
      3. 触发 Major GC 清理老年代的空间
      4. 放的下 成功
      5. 放不下 OOM
      6. 对于一个大对象,我们会首先在Eden 尝试创建,如果创建不了,就会触发Minor GC

image.png

  • FULL GC:对整个堆来说的,最近几个版本的JDK里默认包括了对永生代即方法区的回收,但是有时候也可以把他和FullGC当做一个。

    • 什么时候会调用FULL GC

      1. System.gc()方法的调用
      2. 老年代空间不足
      3. 永生区空间不足
      4. 堆中分配很大的对象

一句话:常量池一直在方法区,其中的字符串池 JDK1.7之后保存到了堆中。

堆内存调优

public static void main(String[] args) {
    //返回虚拟机试图使用的最大内存
    long max = Runtime.getRuntime().maxMemory(); //字节 1024*1024
    //返回jvm初始化的总内存
    long total = Runtime.getRuntime().totalMemory();

    System.out.println("max="+max+"字节\t"+(max/(double)1024/1024+"MB"));
    System.out.println("total="+total+"字节\t"+(total/(double)1024/1024+"MB"));
    /* 运行后:
    max=1866465280字节   1780.0MB
    total=126877696字节  121.0MB
     */
    //默认情况下,分配的总内存占电脑内存1/4 初始化1/64
}

//面试题:报OOM怎么办?
/*
1.尝试扩大堆内存,如果还报错,说明有死循环代码 或垃圾代码
2.分析内存,看一下哪个地方有问题(专业工具)
*/

扩大内存方法:

Edit Configration>add VM option>输入:-Xms1024m -Xmx1024m -XX:+PrintGCDetails

再次运行:

image.png

新生区+养老区:305664K+699392K=1005056K = 981.5M

说明元空间物理并不存在。

例子2:死循环 OOM

//-Xms8m -Xmx8m -XX:+PrintGCDetails
public static void main(String[] args) {
    String str = "kuangshensayjava";

    while (true){
        str += str + new Random().nextInt(888888888)+ new Random().nextInt(21_0000_0000);
    }
}

image.png

Jprofiler

在一个项目中,突然出现了OOM故障,该如何排除,研究为什么出错~

  • 能够看到代码第几行出错:内存快照分析工具,MAT,Jprofiler
  • Debug,一行行分析代码!

MAT,Jprofiler作用:

  • 分析Dump内存文件,快速定位内存泄漏;
  • 获得堆中的数据
  • 获得大的对象(大厂面试)

11. GC:垃圾回收

image.png

JVM在进行GC时,并不是对这三个区域统一回收。大部分时候回收的是新生代

  • 新生代
  • 幸存区
  • 老年区

GC两种:轻GC,重GC (Full GC,全局GC)

关于GC面试题:

  • JVM的内存模型和分区~详细到每个分区放什么?
  • 堆里面的分区有哪些?Eden, from, to, 老年区,说说它们的特点!
  • GC算法有哪些?怎么用的?标记清除法,标记整理,复制算法,分代收集法。引用计数法。
  • 轻GC与重GC分别在什么时候发生?

1.引用计数法

一般JVM不用,大型项目对象太多了

image.png

2.复制算法

  • -XX:MaxTenuringThreshold=15 设置进入老年代的存活次数条件

image.png

  • 好处:没有内存的碎片,内存效率高
  • 坏处:浪费了内存空间(一个幸存区永远是空的);假设对象100%存活,复制成本很高。

复制算法最佳使用场景:对象存活度较低的时候,新生区~。

3.标记清除算法

标记清除

image.png

  • 优点:不需要额外空间,优化了复制算法。
  • 缺点:两次扫描,严重浪费时间,会产生内存碎片。

4.标记压缩(标记整理) :再优化

  • 三部曲:标记–清除–压缩

image.png

标记清除压缩:再优化

  • 每标记清除几次就压缩一次,或者内存碎片积累到一定程度就压缩。

总结

内存效率:复制算法>标记清除算法>标记压缩算法(时间复杂度)

内存整齐度:复制算法=标记压缩算法>标记清除算法

内存利用率:标记压缩算法=标记清除算法>复制算法

难道没有最优算法吗?

答案:无,没有最好的算法,只有合适的算法(GC也被称为分代收集算法)。

  • 年轻代:存活率低,用复制算法
  • 老年代:存活率高,区域大,用标记-清除-压缩