我把 JVM “开膛破肚”

2,129

欢迎关注微信公众号:石杉的架构笔记(id:shishan100)

我的新课**《C2C 电商系统微服务架构120天实战训练营》在公众号儒猿技术窝**上线了,感兴趣的同学,可以点击下方链接了解详情:

《C2C 电商系统微服务架构120天实战训练营》

文章转自公众号:狸猫技术窝

目录

1. 打怪升级,你绕不开JVM

2. JVM 区域划分

3. 程序计数器

4. Java虚拟机栈

5. Java堆内存

6. 方法区 / Metaspace

7. 本地方法栈

8. 堆外内存

9. 全文总结

1. 打怪升级,你绕不开JVM

JVM,对Java程序员进阶而言,是一个绝对绕不开,也不能绕开的话题。

在你打怪升级、进阶蜕变的路上,势必会遇到项目上线中各种OOM、GC等问题,此时JVM的功底就至关重要了。

这篇文章,我们将从自己写的代码运行角度出发,将JVM“开膛破肚”。看看我们写的代码,在JVM的各区域都干了些啥?

多说一句,对于Java工程师的面试,JVM也是必问的一环,因此无论从面试还是实际工作,你都很有必要夯实自己的JVM功底。

扯得有点远,赶紧拉回来,马上进入正题!

2. JVM 区域划分

jvm的区域,大致有以下几块:

  • 程序计数器

  • 虚拟机栈

  • 方法区

  • 本地方法栈

接下来我们将JVM当成一个生物体,上述部分就是其不同器官。我们将从自己写的Java代码如何通过JVM来运行这一角度,来分析JVM里这些“器官”是如何支撑我们的Java代码跑起来的。

3. 程序计数器

假设我们有如下的一个类,就是最最基本的一个HelloWorld而已:

public class HelloWorld {
    public static void main(String[] args) {
	       System.out.println("Hello World");
    }
}

上面那段代码首先会存在于 “.java” 后缀的文件里,这个文件就是java源代码文件。

但是这个文件是面向我们程序员的,计算机是看不懂这段代码的。

所以此时就得通过编译器,把“.java”后缀的源代码文件编译为“.class”后缀的字节码文件。

这个“.class”后缀的字节码文件里,存放的就是对你写出来的代码编译好的字节码了。

字节码才是计算器可以理解的一种语言,而不是我们写出来的那一堆代码。这个字节码看起来大概是下面这样的:

:这段字节码并不是完全对照着HelloWorld那个类来写的,就是给一段示例,让大家知道“.java”翻译成的“.class”是大概什么样子的。

大概给各位解释一下,图中比如“0: aload_0”这样的就是“字节码指令”,他对应了一条条机器指令,计算机只有读到这种机器码指令,才知道具体应该要干什么。

比如字节码指令可能会让计算机从内存里读取某个数据,或者把某个数据写入到内存里去。各种各样的指令,会指示计算机去干各种各样的事情。

所以到这里,大家首先明白的第一点:Java代码是会被翻译成字节码的,不同字节码指令指挥计算机干不同的事情。

那么在执行字节码指令的时候,JVM里的程序计数器作用是啥呢?

**答案是:**用来记录每个线程当前执行的字节码指令的位置,即记录当前线程目前执行到了哪一条字节码指令。

在实际中,会有多个线程并发执行各种不同的代码,所以每个线程都有自己的程序计数器,专门记录当前线程目前执行到了哪一条字节码指令。

下图更加清晰的展示出了他们之间的关系。

4. Java虚拟机栈

好,我们接着来看。大家都清楚,Java代码执行时,一定是线程来执行某个方法中的代码。就算是最基础的 HelloWorld ,也会有一个main线程来执行main方法里的代码。

在方法里,经常会定义一些方法内的局部变量,比如下面这样,在方法里定义了一个局部变量“name”。

public void sayHello() {
    String name = "hello";
}

所以咱们JVM的这个“器官”就要出场了,JVM必须有一块区域是来保存每个方法内的局部变量等等数据的,这个区域就是Java虚拟机栈

为什么需要这个区域?因为每个线程都会去执行各种方法的代码,方法内还会嵌套调用其他的方法,所以每个线程都要有自己的Java虚拟机栈

如果线程执行了一个方法,那么就会为这个方法调用创建对应的一个栈帧

栈帧里就有这个方法的局部变量表 、操作数栈、动态链接、方法出口等东西。这里别的东西不太好理解,后面我们再通过其他文章详细阐述,这里先理解一个局部变量就可以。

回到上面的例子,比如一个线程调用了上面写的“sayHello”方法,那么就会为“sayHello”方法创建一个栈帧,压入线程自己的Java虚拟机栈里面去。

在栈帧的局部变量表里就会有“name”这个局部变量,下图展示了这个过程。

接着如果“sayHello”方法调用了另外一个“greeting”方法 ,比如下面那样的代码:

这时会给“greeting”方法又创建一个栈帧,压入线程的Java虚拟机栈。

想想为啥会这样?因为sayHello方法里开始执行greeting方法了,而且greeting方法的栈帧的局部变量表里有一个“greet”变量,它是greeting方法的局部变量。

下图展示了这个过程:

接着如果“greeting”方法执行完毕了,就会把“greeting”方法对应的栈帧从Java虚拟机栈里给出栈,然后如果“sayHello”方法也执行完毕了,就会把“sayHello”方法也从Java虚拟机栈里出栈。

这就是JVM中的Java虚拟机栈这个组件的作用。

这块大家需要记住的是:调用执行任何方法时,都会给方法创建栈帧,然后入栈。

在栈帧里存放了这个方法对应的局部变量之类的数据,包括这个方法执行的其他相关的信息,方法执行完毕之后就出栈。

5. Java堆内存

JVM中有另外一个非常关键的区域,就是Java堆,用来存放我们在代码中创建的各种对象的,比如下面的代码:

public void teach(String name) {
  Student student = new Student(name);
  student.study();
}

上面的 “new Student(name)” 就创建了一个Student类型的对象实例,这个对象实例里面会包含一些数据。类似Student这样的对象,就会存放在Java堆内存里。

然后方法的栈帧的局部变量表里,这个引用类型的“student”局部变量就会存放Student对象的地址。你可以认为局部变量表里的“student”指向了Java堆里的Student对象。

下图展示了这个过程:

6. 方法区 / Metaspace

这个方法区是在JDK 1.8以前的版本里,代表JVM中的一块区域,主要是放类似Student类自己的信息的,平时用到的各种类的信息,都是放在这个区域里的,还会有一些类似常量池的东西放在这个区域里。

但是在JDK 1.8以后,这块区域的名字改了,叫做“Metaspace”,可以认为是“元数据空间”这样的意思,当然主要还是存放我们自己写的各种类相关的信息。

7. 本地方法栈

在JDK很多底层API里,比如IO相关的,NIO相关的,网络Socket相关的,如果大家去看他内部的源码,会发现很多地方都不是Java代码。

很多地方都会去走native方法,去调用本地操作系统里面的一些方法,可能调用的都是c语言写的方法,或者一些底层类库,比如下面这样的:

public native int hashCode();

在调用这种native方法的时候,就会有线程对应的本地方法栈,这个里面也是跟Java虚拟机栈类似的,也是存放各种native方法的局部变量表之类的信息。

关于这块,这里就不展开讲了,后续有机会我们再写文章专门阐述。

8. 堆外内存

还有一个区域,不属于JVM,通过NIO中的allocateDirect这种API,可以在Java堆外分配内存空间,然后通过Java虚拟机里的 DirectByteBuffer 来引用和操作堆外内存空间。

很多技术都会用这种方式,因为有一些场景下,堆外内存分配可以提升性能。

9. 全文总结

最后做一点总结:

  • Java代码通过JVM运行时,首先一定会一行一行执行编译好的字节码指令

  • 然后在执行的过程中,对于方法的调用,会通过Java虚拟机栈来为每个方法创建栈帧,入栈和出栈,而且栈帧里有方法的局部变量。

  • 对于对象的创建,会分配到Java堆内存里去

  • 对于类信息的存储,会放在方法区 / Metaspace这样的区域里

  • 另外有两块特殊的区域:

  • 本地方法栈:执行native方法时候用的栈,跟Java虚拟机栈是类似的

  • 堆外内存:可以在Java堆外分配内存空间来存储一些对象。

END

个人公众号:石杉的架构笔记(ID:shishan100)

欢迎长按下图关注公众号:石杉的架构笔记!

公众号后台回复资料,获取作者独家秘制学习资料

石杉的架构笔记,BAT架构经验倾囊相授