JVM系列(三)运行时数据区(概述、线程和程序计数器)

247 阅读6分钟

1. 运行时数据区概述

内存是非常重要的系统资源,是硬盘和CPU的中间仓库及桥梁,承载着操作系统和应用程序的实时运行。JVM内存布局规定了Java在运行过程中内存申请、分配、管理的策略,保证了JVM的高效稳定运行。不同的JVM对于内存的划分方式和管理机制存在着部分差异。结合JVM虚拟机规范,来探讨一下经典的JVM内存布局。

image.png

Java虚拟机定义了若干种程序运行期间会使用到的运行时数据区,其中有一些会随着虚拟机启动而创建,随着虚拟机退出而销毁。另外一些则是与线程一一对应的,这些与线程对应的数据区域会随着线程开始和结束而创建和销毁。

  • 线程私有:程序计数器,栈,本地栈
  • 线程共享:堆,堆外内存(永久代或元空间、代码缓存) 可参考官方链接 docs.oracle.com/javase/spec…

1.1 Error vs GC

ErrorGC
程序计数器××
虚拟机栈×
本地方法栈×
方法区

2. 线程

  • 线程是一个程序里的运行单元,JVM允许一个应用程序有多个线程并行执行
  • 在Hotspot JVM里,每个线程都与操作系统的本地线程直接映射
    • 当一个Java线程准备好执行以后,此时一个操作系统的本地线程也同时创建。Java线程执行终止后,本地线程也会回收
  • 操作系统负责所有线程的安排调度到任何一个可用的CPU上。一旦本地线程初始化成功,它就会调用Java线程中的run()方法
  • 使用jconsole或者任何一个调试工具,都能看到在后台有许多的线程在运行。这些后台线程不包括调用public static void main(String[] args)的main线程以及所有这个main线程自己创建的线程;这些主要的后台系统线程在Hotspot虚拟机里主要是以下几个:
    • 虚拟机线程:这种线程的操作是需要JVM达到安全点才会出现。这些操作必须在不同的线程中发生的原因是他们都需要JVM达到安全点,这样堆才不会变化。这种线程的执行类型包括"stop-the-world"的垃圾收集,线程栈收集,线程挂起以及偏向锁撤销;
    • 周期任务线程:这种线程是时间周期事件的体现(比如中断),他们一般用于周期性操作的调度执行;
    • GC线程:这种线程对在JVM里不同种类的垃圾收集行为提供了支持;
    • 编译线程:这种线程在运行时会将字节码编译成本地代码;
    • 信号调度线程:这种线程接收信号并发送给JVM,在它内部通过调用适当的方法进行处理

3. 程序计数器(PC Register)

3.1 PC Register介绍

JVM中的程序计数寄存器(Program Counter Register)中,Register的命名源于CPU的寄存器,寄存器存储指令相关的现场信息。CPU只有把数据装载到寄存器才能够运行。这里,并非是广义上所指的物理寄存器,或许将其翻译成PC计数器(或指令计数器)则会更加贴切一些(也成为程序钩子)。JVM中的PC寄存器是对物理PC寄存器的一种抽象模拟。

  • 它是一块很小的内存空间,几乎可以忽略不计。也是运行速度最快的存储区域
  • 在JVM规范中,每个线程都有他自己的程序计数器,是线程私有的,生命周期与线程的生命周期保持一致
  • 任何时间一个线程都只有一个方法在执行,也就是所谓的当前方法。程序计数器会存储当前线程正在执行的Java方法的JVM 指令地址;或者,如果是在执行native方法,则是未指定值(undefined)
  • 它是程序控制流的指示器,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成
  • 字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令
  • 它是唯一一个在Java虚拟机规范中没有规定任何OutOfMemoryError情况的区域

3.2 作用

PC寄存器用来存储指向下一条指令的地址,也即将要执行的指令代码。由执行引擎读取下一条指令。

image.png

3.3 代码演示

public class PCRegisterTest {
    public PCRegisterTest() {
    }

    public static void main(String[] args) {
        int i = 10;
        int j = 20;
        int var10000 = i + j;
    }
}

部分输出如下:

      stack=2, locals=4, args_size=1
         0: bipush        10
         2: istore_1
         3: bipush        20
         5: istore_2
         6: iload_1
         7: iload_2
         8: iadd
         9: istore_3
        10: return

其中前面一列的数字表示指令地址(偏移地址),是PC寄存机中实际存储的数据,后面一列为操作指令。执行引擎会从PC寄存器中存储的数据所代表的位置取相应的指令;执行引擎会操作局部变量表、操作数栈,并将字节码指令翻译成机器指令。

3.4 问题

3.4.1 使用PC寄存器存储字节码指令地址有什么用

因为CPU需要不停地切换各个线程,这时候切换回来以后,就得知道接着从哪里开始继续执行;JVM字节码解释器就需要通过改变PC寄存器的值来明确下一条应该执行什么样的字节码指令。

3.4.2 PC寄存器为什么会被设定为线程私有

我们都知道所谓的多线程在一个特定的时间段内只会执行其中某一个线程的方法,CPU会不停地做任务切换,这样必然导致经常中断或护肤,如何保证分毫无差呢?为了能够准确记录各个线程正在执行的当前字节码指令地址,最好的办法自然是为每一个线程都分配一个PC寄存器,这样一来各个线程之间便可以进行独立计算,从而不会出现相互干扰的情况。

3.5 CPU时间片

CPU时间片即CPU分配给各个程序的时间,每个程序被分配一个时间段,称作它的时间片。在宏观上,我们可以同时打开多个应用程序,每个程序并行不悖,同时运行。但在微观上,由于只有一个CPU, 一次只能处理程序要求的一部分,如何处理公平,一种方法就是引入时间片,每个程序轮流执行。