Android面试之「JVM 篇 (上)」知识总结： 1.JVM 存储 2.垃圾回收机制

本文为原创文章，如需转载请注明出处，谢谢!

概述

本文将围绕以下3点对 JVM 知识进行总结，知识全部源于《深入理解 JVM》

1.JVM 存储
2.垃圾回收机制
3.类加载

一、JVM 存储

首先盗张图

JVM 内存模型

1. 程序计数器 (Program Counter Register)

概念：一块较小的内存空间，是字节码解释器的行为指示器。

概念比较抽象，我们知道程序执行的过程中会有分支、循环、跳转、异常处理、线程恢复等基础功能，也就是程序运行碰到了关键字或特殊行为，字节码解释器就需要进行特殊处理，而字节码需要怎么做正是由程序计数器去通知。

程序计数器是在每条线程中独立存在的一块内存，不与其他线程共享，所以这类内存叫「线程私有」的内存。

2. Java 虚拟机栈 (VM Stack)

概念：Java 方法执行的内存模型，每个方法执行的时候，都会创建一个栈帧用于保存局部变量表，操作数栈，动态链接，方法出口信息等。一个方法调用的过程就是一个栈帧从 VM 栈入栈到出栈的过程。（平时说的「堆和栈」的栈就是他了）

这个概念就比较友好了，VM 栈主要用于存储方法包含的信息：

局部变量表:
-基本数据类型(byte,short,int,long,float,double,boolean)
-引用类型(reference 类型，可能是指向一个对象起始地址的引用指针，或是指向另一个引用指针的引用)
-returnAddress 类型（我理解的是方法返回值类型）

另外，这个区域中有两种异常：StackOverflowError，OutOfMemoryError，很熟悉对吧。我们都知道递归深度达到一定程度，StackOverflow 就出现了，也就是 VM 栈的深度小于你请求的深度了。在栈的深度增加时，会开辟新内存，如果无法申请到足够的内存，OutOfMemory 就出现了。

最后，VM 栈也是线程私有的。

3. 本地方法栈 (Native Method Stack)

概念：执行 Native 方法的栈

与 VM 栈发挥的作用非常相似，VM 栈执行Java 方法（字节码）服务，Native 方法栈执行的是 Native 方法服务。

同样的，有两种异常：StackOverflowError，OutOfMemoryError。

Native 栈也是线程私有的。

4. Java 堆 (Java Heap)

概念：所有线程共享的一块内存区域，在虚拟机启动时创建。此内存区域唯一的目的就是存放对象实例，几乎所有的对象都在这分配内存。

概念也说的比较清楚了，这里存放我们 new 的所有对象。如何管理这些对象呢？一般的虚拟机的垃圾收集器(GC)都采用分代收集算法（在总结垃圾回收的时候会详细说，这里我们先记住），所以 Java 堆可被细分为：新生代和老年代，更细的分法这里就不总结了。

无论 Java 堆怎样划分，都与存储的内容无关，存储的永远都是对象实例，划分区域的目的是为了更好地回收内存，更快地分配内存。

当堆中没有内存完成实例分配时，OutOfMemory 就出现了。

Java 堆是线程共享的。

5. 方法区 (Method Area)

概念：存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码数据等。

这部分区域包含「运行时常量池」，所以这个区域主要存储常量。方法区也常被人成为「永久代」（Permanent Generation)，但两者本质并不相同，永久代是垃圾收集器的一种分区方法，这样方法区可以和 Java 堆一样用一套回收算法，省的再为方法区单独编写管理内存的代码了。

另外，JDK 1.6 中常量池和 Java 堆是分离的，JDK 1.7 中，常量池和 Java 堆合并共用一块内存。所以 String.intern()在 1.6 和 1.7 中的使用会有所不同。具体参考这篇文章
tech.meituan.com/in_depth_un…

当方法区无法满足内存分配需求时，OutOfMemory 就出现了。

方法区是线程共享的。

二、垃圾回收机制

首先思考两个问题

1.怎样判定一个对象的存活或死亡？2.垃圾收集器是怎样管理对象的？

1. 引用计数法

一个教科书式的判断对象存活的算法，简单来说是这样的：给对象增加一个引用计数器，每当有地方引用这个对象时，计数器加一，当引用失效时，计数器减一。这个算法实现简单，判定效率也高，但是，Java 虚拟机中并没有选这种算法来管理内存，原因是它很难解决对象之间循环引用的问题。例子如下

public class ReferenceCountingGC {
    public Object instance = null;

    private static final int _1MB = 1024 * 1024;

    /**
     * 这个成员的唯一意义就是占用内存，以便 GC 日志中看到对象被回收
     */
    private byte[] bigSize = new byte[2 * _1MB];

    public static void testGC() {
        ReferenceCountingGC a = new ReferenceCountingGC();//对象 A
        ReferenceCountingGC b = new ReferenceCountingGC();//对象 B
        a.instance = b;
        b.instance = a;

        a = null;
        b = null;
        //假设在这行发生 GC,A 和 B 能否被回收？
        System.gc();
    }

}

这里我们先说结论，虽然 A 对象和 B 对象互相引用，但虚拟机还是回收了它们，所以JVM 采用的不是引用计数法来管理内存的。在之后的小节再详细回答这个问题。

2. 可达性分析算法

带着上面的问题来理解这个算法，首先看张图

GC Roots

我们看图中右半部分，也许上面的问题就有了答案，虽然这三个对象互相引用，但是没有 GC Roots 引用他们，所以这三个对象还是要被回收。那么问题又来了，什么是 GC Roots 呢？

在 Java 语言中，可作为 GC Roots:
1.虚拟机栈(栈帧中的本地变量表)中引用的对象
2.方法区中类静态属性引用的对象
3.方法区中常量引用的对象
4.本地方法栈中 JNI(一般说的 Native 方法)引用的对象

清楚了 GC Roots 就可以分析上面的问题了，a 和 b 是 testGC()方法中的变量，保存在局部变量表中(虚拟机栈)中，所以 a 和 b 是 GC Roots，所以此时 A 和 B 对象是活着的，不会被回收。然后 a.instance = b，b.instance = a，instance 是 ReferenceCountingGC 对象的一个成员变量，不属于 GC Roots 范围内，所以尽管 A 和 B 对象在互相引用也无济于事，垃圾收集器还是将他们回收了。

3. 标记-清除算法 (Mark-Sweep)

算法如其名，先标记出需要回收的对象，然后一并回收被标记过的对象。这里只简单总结一下标记的过程。

我们上一节知道了如果对象没有 GCRoots 引用，就可判定为对象不可用，这也正是标记的第一步，如果对象已经被标记一次，它将被进行一次筛选，筛选条件为对象是否重写了 finalize()方法，或者 finalize()已经被虚拟机调用。当对象没重写或 finalize()已经被执行过，就证明对象已经没有可能再回到可用状态，待虚拟机第二次标记它时，就会被放到回收的集合中。

上面提到了对象还有可能回到可用状态，秘密就在 finalize()方法中，假如第一次标记后发现对象重写了 finalize()，而且没被虚拟机调用过，对象就会被加入 F-Queue 队列中，然后会有一条优先级低的 Finalizer 线程去执行队列中对象的 finalize()方法，如果对象在 finalize()中完成了自我救赎，比如把 this 指向了其他的对象，那么在 F-Queue 中的第二次标记就会将其移除出回收集合。

接下来说这个算法的不足：

效率不高，标记和清除两个过程的效率都不高
空间问题，标记清除之后会导致内存中出现大量的不连续的内存碎片，之后分配较大对象的内存空间时，导致没有足够的连续内存，可能会触发另一次的垃圾回收，这个问题也间接的反映出了效率不高。

知道了缺点，就应该避免，所以 JVM 并不是只用这一个算法去垃圾回收，而是在对象存活率较高的时候，使用这个算法。

4.标记-整理算法 (Mark-Compact)

这可以说是标记-清除的升级版算法，上一节中说到标记-清扫容易导致内存出现碎片，而这个算法解决了这一问题。标记-整理是在标记后，将存活的对象都向前移动，等到所有存货对象都移动到了内存空间的最前端时，再回收后面的不可用对象。

5.复制算法

为了解决效率问题，复制算法出现了，它将可用内存容量划分为大小相等的两块，每次只用其中的一块。当这块内存用完了，就将还存活的对象复制到另一块上，然后清除已使用的那块。这样每次固定回收一半内存，实现简单，运行高效，并且不会出现内存碎片。

但是这个算法的代价也很大，就是要牺牲一半的内存。

6.分代收集算法

当前商业虚拟机的垃圾收集都是采用的「分代收集算法」，主要是将堆分为新生代和老年代。
新生代：对象存活率低，每次垃圾回收后都只有少量对象存活，所以此时用复制算法。
老年代：对象存活率高，大量存活的对象，此时用标记-清除(标记-整理）算法。

由于篇幅有限，类加载相关内容将放到 JVM 篇(下）中总结

我也是个初学者，如写的有问题，请及时联系我！感谢！