学编程还在死记硬背?图解才是永远滴神——图解虚拟机栈和栈帧

1,320 阅读9分钟

「这是我参与11月更文挑战的第30天,活动详情查看:2021最后一次更文挑战

1、虚拟机栈与栈帧

Java的JVM划分为堆、栈、方法区等模块,这里的栈指的就是虚拟机栈;那什么是栈帧?虚拟机栈和栈帧又有什么关系呢?先来看一段代码:

/**
 * @Author: Liziba
 * @Date: 2021/11/26 18:50
 */
public class ThreadDemo4 {

    public static void main(String[] args) {
        while (true) {
            method();
        }
    }

    private static void method() {
        method();
    }

}

这段代码演示了一个错误递归调用的方式,很显然当main方法执行的时候,程序会抛出java.lang.StackOverflowError异常,这个异常大家都知道叫栈溢出,那为什么会抛出这个异常呢?

之所以会抛出StackOverflowError异常,这就和栈帧有关了。把上面的代码稍微改进一下,统计方法调用多少次后会抛出StackOverflowError异常。改进后的代码:

public class ThreadDemo4 {

    private static AtomicInteger count = new AtomicInteger(0);
    public static void main(String[] args) {
        while (true) {
            method();
        }
    }

    private static void method() {
        System.out.println(count.addAndGet(1));
        method();
    }

}

多次执行结果均接近于10535,可以推导出:每个线程的栈的大小是固定的,每次方法调用时就会往栈里面存入东西,在无限递归的场景下,一直存一直存就出现了内存溢出的情况。

为了验证每个线程分配的的栈内存的大小是固定的,我们可以通过修改VM options -Xss参数,设置每个线程分配的的栈内存的大小为128k(注意这个值不能太小,否则虚拟机启动就会抛出异常)

将线程分配的的栈内存空间调小之后,再次执行上述代码,发现程序大概执行了970次左右就会抛出StackOverflowError异常,这样就确信栈的线程分配的的栈内存空间大小是一个固定值了。

有了这些铺垫,后面的内容才会思路清晰,就可以很好的解释什么是栈帧?虚拟机栈和栈帧又有什么关系呢?

2、什么是栈帧

虚拟机为什么会划分一块虚拟机栈内存呢?其实虚拟机栈的内存空间是给线程使用的,每个线程启动后,虚拟机为其分配一块栈内存空间;每个线程分配的虚拟机栈内存区域由多个栈帧(Frame)组成,栈帧对应着每个方法调用时所占用的内存(线程运行时,其实就是执行我们编写的源代码编译后的字节码嘛、说到底就是一个个的方法调用);每个栈帧的由局部变量表、操作数栈、动态链接、方法返回值地址等组成。

虚拟机栈与栈帧的关系如下:

StackOverflowError异常原因如下:

每个线程分配的栈内存空间就好比一根用来串珠子的绳子,绳子的长度是固定的,并且只能从穿入的那一端出入,珠子就好比线程运行过程中需要执行的方法,珠子有大有小,就好比方法因为其局部变量等原因,内存大小不一。每当调用一个方法,就需要穿入一颗珠子,方法执行完毕,珠子就会取出来。而上述例子发生StackOverflowError异常的原因,就是方法一直在循环调用没有返回,导致线程的分配的栈内存达到上限抛出了StackOverflowError异常。

3、IDEA中如何DEBUG栈帧

IDEA是主流的Java代码编写工具,学会如何在IDEA中DEBUG栈帧,是一项必备的小技能。(其实我相信大部分人都会用,但是它们并不一定知道这就是栈帧);简单的示例代码如下所示:

/**
 * @Author: Liziba
 */
public class FrameDemo {

    public static void main(String[] args) {
        method1(1);
    }

    private static void method1(int x) {
        Object o = method2();
        int y = x * x;
        System.out.println(y);
    }

    private static Object method2() {
        Object o = new Object();
        return o;
    }

}

在三个方法的如下所示位置分别加上断点,并且以DEBUG方式启动,使用F7步进(Step into)的方式进行DEBUG

初始执行的是main方法,main方法的参数是一String数组,参数名称为args,此时可以看到Variables变量表中有一个args={String[0]@483},数组对象的大小为0,因为我们并未设置启动相关参数。

F7步进(Step into)进入method1,此时线程栈栈帧表Frames中有两个栈帧,method1的栈帧中有一个局部变量x,这个变量时从main方法中传递过来的。

F7步进(Step into)进入method2,此时线程栈栈帧表Frames中有三个栈帧,method2的栈帧中有一个局部变量o,这个局部变量时在method2中实例化的Object对象

F7步进(Step into)method2结束,此时Frames中只有method1和main方法两个栈帧,method2方法由于运行结束方法返回后,就会弹栈(出栈)。继续F7步进(Step into)到System.out.println(y);可以看到如下局部变量表,新增了o和y。

F7步进(Step into)method1结束,此时Frames中只有main方法一个栈帧,method1方法由于运行结束方法返回后,就会弹栈(出栈)。

F7步进(Step into)main结束,此时Frames中所有的栈帧都随着方法方法而弹栈(出栈)。整个程序随着主线程的运行结束而结束。

其实上述的过程就是DEBUG一个线程在虚拟机栈中分配的栈内存中栈帧的出入栈情况。当时大多数情况下,方法调用情况和内部逻辑会比上述情况复杂的多,并且会有多线程的场景,在多线程情况下需要将断点设置成Thread模式。右键单击断点,选择Thread -> Done即可。

多个线程进行DEBUG,则可以在启动的进程窗口下Threads中切换线程。

4、图解方法调用时栈帧变化

示例代码

/**
 * @Author: Liziba
 */
public class FrameDemo {

    public static void main(String[] args) {
        method1(1);
    }

    private static void method1(int x) {
        Object o = method2();
        int y = x * x;
        System.out.println(y);
    }

    private static Object method2() {
        Object o = new Object();
        return o;
    }

}

图解方法调用时栈帧的变化,涉及到JVM层面的知识点,其中包括方法区、堆、虚拟机栈、栈帧、程序计数器,其大致作用如下所示:


方法区

方法区是虚拟机中一块线程共享的内存区域,用于存储类信息、常量池、静态变量、编译后的字节码等信息。在我们这个例子中,JVM层面执行的是字节码指令,而这些指令就是存储在方法区中。

堆是虚拟机中最大的一块线程共享的内存区域,堆是Java内存管理的核心区域,所有的对象实例和数组都在堆中分配内存。

虚拟机栈

虚拟机栈是线程私有的内存区域。虚拟机栈的内存空间是给线程使用的,每个线程启动后,虚拟机为其分配一块栈内存空间,虚拟机栈中存在多个栈帧。

栈帧

每个线程分配的虚拟机栈内存区域由多个栈帧(Frame)组成,栈帧对应着每个方法调用时所占用的内存;每个栈帧的由局部变量表、操作数栈、动态链接、方法返回值地址等组成。

程序计数器

程序计数器是一块内存很小的线程私有的内存空间,每个线程都有自己的程序计数器。任何时间一个线程都只有一个方法在执行,程序计数器会记录当前执行方法中的JVM指令地址,用于控制程序的正确执行。程序的分支、跳转、循环、异常以及线程切换都需要依靠程序计数器来完成。

第一步执行main函数:

public static void main(String[] args) {
    method1(1);
}

执行main函数,此时虚拟机栈中会为main线程分配一块栈内存供main线程运行(main线程栈),此时main线程栈中会压入一个main函数栈帧,main函数拥有一个String[] args局部变量,因此局部变量表中args指向一个堆中的String数组(局部变量表会在方法运行之前就创建完成,分配好内存)。

第二步method1函数准备工作:

private static void method1(int x) {
    Object o = method2();
    int y = x * x;
    System.out.println(y);
}

main函数中只有一句代码,调用了method1函数,此时程序计数器指向该方法(实际上指向的是JVM字节码指令的地址),并且此时main线程栈中会压入一个method1函数栈帧,method1函数中有三个局部变量,分别是x、o、y,此时只有x的值由方法传递已知,因此x=1;除此之外method1栈帧的返回地址指向方法区中method1

第三步method2函数准备工作:

private static Object method2() {
    Object o = new Object();
    return o;
}

method1栈帧创建完成之后,程序计数器会依次指向method1函数中的字节码指令,此时局部变量表中的局部变量将会被赋值,执行到method1中的第一行代码的字节码指令时,调用了method2函数,此是main线程栈中会压入一个method2函数栈帧

第四步执行method2函数中字节码指令:

method2函数中只有一句代码,在堆内存中创建了一个Object对象,并且将对象地址赋值给o引用(这句代码在在程序计数器中应该是三条字节码指令,演示为源代码看起来更加方便)

第四步执行method1函数中字节码指令:

method2执行结束后,main线程栈中method2栈帧会弹出,此时method1局部变量表中的局部变量o接收method2栈帧中返回地址指向的返回值

紧接着执行int y = x * x,此时method1栈帧中局部变量表y被赋值为1,最后执行System.out.println(y)不在演示。

method1函数中字节码执行结束后,method1栈帧弹出,最后main函数中字节码执行结束,main线程栈中栈帧全部弹出,整个main线程执行结束,Java进程终止。

看到这里了要个三连不过分吧!您轻而易举的三连,是对我最大的鼓励和帮助。