Java语言最大的特点应该就是它的垃圾回收机制,有了它,我们在编写程序时就不用考虑内存管理,也可以有效的防止内存泄露
谈到垃圾回收,就不得不完成三件事情
- 哪些内存需要回收
- 什么时候回收
- 怎么回收
第一个问题,上一篇(Java内存区域)已经讲到了,Java内存五个区域中,程序计数器、虚拟机栈,本地方法区的生命周期都是跟随线程的,所以GC不会在这个几个区域中进行回收,因为方法结束或者线程结束,内存会自动跟着一起回收。而Java堆和方法区就不一样,这两块的内存分配是动态的,只有在程序运行期间才知道内存是怎么分配的。
第二个问题,什么时候回收,不能我刚new了一个对象,还没热乎,下一步准备调用,就给我回收了。所以需要有一个机制或者说算法来判断这个对象是否需要回收。目前判断对象是否能进行回收的算法一般讲到的就是两种
引用计数法
为每一个对象添加一个引用计数器,每当有地方引用这个对象时,引用计数器就+1,当引用失效时,计数器就-1,任何时候,引用计数器的值为0时,就表示这个对象不可能再被使用了。
但是这种算法有个很明显的缺点,就是无法解决循环引用。比如A对象引用了B,B对象引用了A,除此之外,没有其他地方对A、B对象进行引用,很明显,这两个对象已经不能再被访问了,此时A、B对象中引用计数器值都为1,于是引用计数器无法通知GC回收器来对他们进行回收
可达性分析算法
现在Java的垃圾回收机制中,就是通过可达性分析算法来判定对象是否存活。这个算法就是从一系列的GC Roots节点开始,寻找对应的引用节点,然后在继续寻找所有引用节点的引用节点,直到所有的引用节点寻找完毕。其他剩余的节点就是无用的节点。
如上图所示,左边的Object7、Object8、Object9虽然有关联,但是GC Roots到他们是不可到达的,所以这是三个对象就会被判定为可回收对象
那么,有哪些对象可以作为GC Roots呢
在Java语言中,可作为GC Roots的对象包括下面几种:
- 虚拟机栈中引用的对象(本地变量表)
- 方法区中类静态属性引用的对象
- 方法区中常量引用的对象
- 本地方法栈中引用的对象(Native对象)
如果一个对象根据可达性分析算法认为不可达,这个对象不是立马被回收,一个对象要被回收会被经历两次标记过程,被认为不可达时,会进行第一次标记,并且会进行一次筛选,筛选的的条件是该对象是否有必要执行finalize()方法。如果对象没有覆盖finalize()方法或者已经被虚拟机调用过一次finalize()方法了,那么虚拟机会将这两种情况视为没有必要执行。
如果这个对象有必要执行finalize()方法,那么这个对象会被放在一个队列中,然后会由一个虚拟机自动建立的、低优先级的Finalizer线程去执行它。稍后GC会对队列中的对象进行第二次标记,如果对象重写的finalize()中将自己与引用链上任何一个对象进行关联,那么他在第二次标记的过程中会被移除即将回收的集合
finalize()方法是Java刚出来是为C/C++程序员更容易接受而做出的妥协,不建议使用finalize()方法。
第三个问题,怎么回收,这就是各种虚拟机所用到的垃圾收集算法。下面介绍几种算法的思想
标记-清除算法
和名字一样,该算法分为标记和清除两个阶段,标记过程在上面介绍过了。该算法效率慢,最致命的就是会导致大量的内存碎片,然后到程序运行时,要分配较大的内存空间时,会因为无法找到足够的内存空间而不得不提前触犯一次垃圾回收
如上图所示,垃圾回收后,产生了大量的内存碎片,假如有一个对象的大小是三个格子,上面就没有一块这么大的内存空间可以分配
复制算法
复制算法将可用内存划分为两块,每次只使用其中一个块,当这一块内存用完了,就将这块中还存活的对象复制到另一块中,然后在把第一块的内存空间一次清理掉。这样使得每次垃圾回收都是对半个区间进行,也不会产生垃圾碎片。但这个算法每次只使用内存的一半,代价太高。
现在的虚拟机一般采用分代收集收集算法,其中的新生代就是采用复制算法,IBM公司的研究表明,新生代中的对象98%都会被回收的,但是不是将新生代的内存空间按照1:1的空间来划分,而是将新生代分为Eden区和两个Survivor区,比例是8:1:1,每次使用时,都是使用Eden区和一块Survivor区,当要进行垃圾回收时,将Eden区和Survivor区中存活的对象移动到另外一块Survivor中。当然,当另外一块Survivor区中的空间不够用时,会将剩下的对象直接移动到老年代中去。
标记-整理算法
当对象存活率比较高,还继续用复制算法的话,效率将会堪忧。而Java堆中老年代就是存活率很高的对象。所以根据老年代的特点,标记-整理算法就被提出来了,标记的过程和标记-清除算法中标记的过程一样,但是标记完成后,不直接对对象进行回收,而是将存活对象移动到一端,然后直接清理掉这一端边界以外的内存。
分代收集算法
分代收集算法并不是一种什么算法,就是根据前面几种算法,根据Java内存区域中不同区域采用不用不同的算法。一般是Java分为新生代和老年代,新生代中对象存活率较低,每次进行垃圾回收时,都会有大量的对象被回收,所以对新生代一般采用复制算法。而老年代中的对象都是些存活率高、占用内存大的对象,采用复制算法效率低,所以必须采用标记-清理算法或者标记-整理算法。
微信公众号:易大师的小屋