JavaScript深入之带你走进内存机制

153 阅读7分钟

JS内存空间分为栈(stack)堆(heap)池(一般也会归类为栈中) 。 其中存放变量,存放复杂对象,存放常量,所以也叫常量池。

内存回收

JavaScript有自动垃圾收集机制,垃圾收集器会每隔一段时间就执行一次释放操作,找出那些不再继续使用的值,然后释放其占用的内存。

  • 局部变量和全局变量的销毁

    • 局部变量:局部作用域中,当函数执行完毕,局部变量也就没有存在的必要了,因此垃圾收集器很容易做出判断并回收。
    • 全局变量:全局变量什么时候需要自动释放内存空间则很难判断,所以在开发中尽量避免使用全局变量。
  • 以Google的V8引擎为例,V8引擎中所有的JS对象都是通过来进行内存分配的

    • 初始分配:当声明变量并赋值时,V8引擎就会在堆内存中分配给这个变量。
    • 继续申请:当已申请的内存不足以存储这个变量时,V8引擎就会继续申请内存,直到堆的大小达到了V8引擎的内存上限为止。
  • V8引擎对堆内存中的JS对象进行分代管理

    • 新生代:存活周期较短的JS对象,如临时变量、字符串等。
    • 老生代:经过多次垃圾回收仍然存活,存活周期较长的对象,如主控制器、服务器对象等。

垃圾回收算法

对垃圾回收算法来说,核心思想就是如何判断内存已经不再使用,常用垃圾回收算法有下面两种。

  • 引用计数(现代浏览器不再使用)
  • 标记清除(常用)

引用计数

引用计数算法定义“内存不再使用”的标准很简单,就是看一个对象是否有指向它的引用。如果没有其他对象指向它了,说明该对象已经不再需要了。

// 创建一个对象person,他有两个指向属性age和name的引用
var person = {
    age: 12,
    name: 'aaaa'
};

person.name = null; // 虽然name设置为null,但因为person对象还有指向name的引用,因此name不会回收

var p = person; 
person = 1;         //原来的person对象被赋值为1,但因为有新引用p指向原person对象,因此它不会被回收

p = null;           //原person对象已经没有引用,很快会被回收

引用计数有一个致命的问题,那就是循环引用

如果两个对象相互引用,尽管他们已不再使用,但是垃圾回收器不会进行回收,最终可能会导致内存泄露。

function cycle() {
    var o1 = {};
    var o2 = {};
    o1.a = o2;
    o2.a = o1; 

    return "cycle reference!"
}

cycle();

cycle函数执行完成之后,对象o1o2实际上已经不再需要了,但根据引用计数的原则,他们之间的相互引用依然存在,因此这部分内存不会被回收。所以现代浏览器不再使用这个算法。

但是IE依旧使用。

var div = document.createElement("div");
div.onclick = function() {
    console.log("click");
};

上面的写法很常见,但是上面的例子就是一个循环引用。

变量div有事件处理函数的引用,同时事件处理函数也有div的引用,因为div变量可在函数内被访问,所以循环引用就出现了。

标记清除(常用)

标记清除算法将“不再使用的对象”定义为“无法到达的对象”。即从根部(在JS中就是全局对象)出发定时扫描内存中的对象,凡是能从根部到达的对象,保留。那些从根部出发无法触及到的对象被标记为不再使用,稍后进行回收。

无法触及的对象包含了没有引用的对象这个概念,但反之未必成立。

所以上面的例子就可以正确被垃圾回收处理了。

所以现在对于主流浏览器来说,只需要切断需要回收的对象与根部的联系。最常见的内存泄露一般都与DOM元素绑定有关:

email.message = document.createElement(“div”);
displayList.appendChild(email.message);

// 稍后从displayList中清除DOM元素
displayList.removeAllChildren();

上面代码中,div元素已经从DOM树中清除,但是该div元素还绑定在email对象中,所以如果email对象存在,那么该div元素就会一直保存在内存中。

内存泄漏

对于持续运行的服务进程(daemon),必须及时释放不再用到的内存。否则,内存占用越来越高,轻则影响系统性能,重则导致进程崩溃。 对于不再用到的内存,没有及时释放,就叫做内存泄漏(memory leak)

内存泄漏识别方法

1、浏览器方法

  1. 打开开发者工具,选择 Memory
  2. 在右侧的Select profiling type字段里面勾选 timeline
  3. 点击左上角的录制按钮。
  4. 在页面上进行各种操作,模拟用户的使用情况。
  5. 一段时间后,点击左上角的 stop 按钮,面板上就会显示这段时间的内存占用情况。

2、命令行方法

使用 Node 提供的 process.memoryUsage 方法。

console.log(process.memoryUsage());

// 输出
{ 
  rss: 27709440,		// resident set size,所有内存占用,包括指令区和堆栈
  heapTotal: 5685248,   // "堆"占用的内存,包括用到的和没用到的
  heapUsed: 3449392,	// 用到的堆的部分
  external: 8772 		// V8 引擎内部的 C++ 对象占用的内存
}

判断内存泄漏,以heapUsed字段为准。

WeakMap

ES6 新出的两种数据结构:WeakSet 和 WeakMap,表示这是弱引用,它们对于值的引用都是不计入垃圾回收机制的。

弱引用

澄清一下,与强引用不同,弱引用不会阻止被引用的对象被垃圾回收器回收,即使它是内存中对该对象的唯一引用。

在进入强引用、WeakSetSetWeakMapMap介绍之前,让我们用下面的片段来说明弱引用。

// 创建一个WeakMap对象的实例。
let human = new WeakMap():
​
// 创建一个对象,并把它赋给一个叫做man的变量。
let man = { name: "Joe Doe" };
​
// 对human调用set方法,并向其传递两个参数(key和value)。
human.set(man, "done")
​
console.log(human)

上面代码的输出将是以下内容。

WeakMap {{…} => 'done'}
​
man = null;
console.log(human)

man参数现在被设置为WeakMap对象。在我们将man变量重新赋值为null的时候,内存中对原始对象的唯一引用是弱引用,它来自我们之前创建的WeakMap。当JavaScript引擎运行一个垃圾回收过程时,man对象将从内存和我们分配给它的WeakMap中删除。这是因为它是一个弱引用,并不能阻止垃圾回收。

看起来我们正在取得进展。让我们来谈谈强引用,然后我们将把一切联系起来。

强引用

JavaScript中的强引用是一种防止对象被垃圾回收的引用。它将对象保留在内存中。

下面的代码片断说明了强引用的概念。

let man = {name: "Joe Doe"};
​
let human = [man];man =  null;
console.log(human);

上面的代码的结果将是这样的。

// 一个长度为1的对象数组。
[{...}]

由于人的数组和对象之间存在强引用,所以不能再通过man的变量来访问该对象。该对象被保留在内存中,可以通过以下代码进行访问。

console.log(human[0])

这里需要注意的是,弱引用并不能阻止一个对象被垃圾回收,而强引用可以阻止一个对象被垃圾回收。