边学边译JS工作原理 -- 2 . V8 引擎中书写最优代码的 5 条小技巧这是 JavaScript 工作原理的第二章

原文请查阅这里，略有删减，本文采用知识共享署名 4.0 国际许可协议共享，BY Troland。
本章学习需要预知几个概念，解释器，编译器，字节码，机器码，中间码，内存指针等。如果你对这些概念不了解，可能很快看的一头雾水。但是不要紧，也可以不用细扣每一个名词，先通读有一些基本概念。
本章推荐指数：5

提前参考这个帖子

这是 JavaScript 工作原理的第二章。

本章将会深入谷歌 V8 引擎的内部结构。我们也会为如何书写更好的 JavaScript 代码提供几条小技巧。

概述

一个 JavaScript 引擎就是一个程序或者一个解释器，它运行 JavaScript 代码。
一个 JavaScript 引擎可以用标准解释器或者即时编译器来实现，即时编译器即以某种形式把 JavaScript 解释为字节码。

以下是一系列实现 JavaScript 引擎的热门项目：

V8－由谷歌开源的以 C++ 语言编写
Rhin－由 Mozilla 基金会主导，开源的，完全使用 Java 开发。
SpiderMonkey－初代 JavaScript 引擎，由在之前由网景浏览器提供技术支持，现在由 Firefox 使用。
JavaScriptCore－开源，以 Nitro 的名称来推广，并由苹果为 Safari 开发。
KJS－KDE 引擎，起先是由 Harri Porten 为 KDE 工程的 Konqueror 浏览器所开发。
Chakra (JScript9)－IE
Chakra (JavaScript)－Microsoft Edge
Nashorn－作为 OpenJDK 的一部分来开源，由 Oracle Java 语言和 Tool Group 编写。
JerryScript－一款轻量级的物联网引擎。

V8 引擎的由来

V8 引擎是由谷歌开源并以 C++ 语言编写。
Chrome 内置了这个引擎，也被应用于时下流行的 Node.js 运行时中。

起先 V8 是被设计用来优化网页浏览器中的 JavaScript运行性能的。
为了达到更快的执行速度，V8 通过实现一个即时编译器（JIT）在运行阶段把 JavaScript 代码编译为机器码，就像诸如 SpiderMonkey or Rhino (Mozilla) 等JavaScript引擎所做的那样。同时V8 不产生字节码或者任何的中间码。

PS：解释器和编译器的区别是什么？

机器码是CPU可以直接执行的代码，一般由编译器生成。字节码也是中间代码的一种，比如JAVA的编译就是字节码。执行时，字节码会被解释器解释成机器码。

V8 曾经拥有两个编译器

在 V8 5.9诞生(2017 年初) 之前，引擎拥有两个编译器：

full-codegen－一个简单且快速的编译器用来产出简单且运行相对缓慢的机器码。
Crankshaft－一个更复杂(即时)优化的编译器用来产生高效的代码。

V8 引擎内部也使用多个线程：

主线程做你所期望的事情---抓取代码，编译后执行
有独立的线程来编译代码，这样就可以独立优化代码而不阻塞主线程
一个用于性能检测的线程会告诉运行时我们在哪个方法上花了太多的时间，以便于让 Crankshaft 来优化这些代码
有几个线程用来处理垃圾回收器的清理工作。

当第一次执行 JavaScript 代码的时候，V8 使用 full-codegen 直接把解析后的JavaScript代码解析为机器码，中间没有任何转换。这使得它一开始非常快速地运行机器码。注意到 V8 没有使用中间字节码来表示，这样就不需要解释器了。

当代码执行一段时间后，性能检测器线程已经收集了足够多的数据来告诉 Crankshaft 哪个函数可以被优化。

接下来，在另一个线程中开始进行 Crankshaft 代码优化。它把 JavaScript 语法抽象树（AST）转化为一个被称为 Hydrogen 的高级静态单赋值（SSA）表征，并且试着优化这个 Hydrogen 图表。大多数的代码优化是发生在这里。来看看有哪些优化动作：

内联

第一个优化方法即是提前尽可能多地内联代码。
内联指的是把调用地址置换为被调用函数的函数体的过程。这个简单的步骤使得接下来的代码优化更有意义。

如图所示，我们在main中调用了function1 和function2。
内联之后，function1 和function2 里的函数体，直接被复制到了main中。

隐藏类

JavaScript 是基于原型的语言：当进行克隆的时候不会创建新的类和对象。
JavaScript 也是一门动态编程语言，实例化之后，可以任意地添加或者移除属性。

大多数的 JavaScript 解释器使用类字典的结构(基于哈希函数)在内存中存储对象属性值的内存地址。
相比Java 或者 C# 的静态编程语言，这种结构使得在 JavaScript 中获取属性值时会更浪费时间。
在静态编程语言中，所有的对象属性都在编译前就已经知道了对象的数据结构，而静态语言一旦生成就不能增删它的属性和属性值对应的类型。
因此，可以将属性值(指向这些属性的指针)以连续的缓冲区的形式存储在内存之中，因为位移的长度可以基于属性类型被简单地计算出来。
然而在 JavaScript 中这是不可能的，因为运行时可以改变属性类型。

由于使用字典在内存中寻找对象属性的内存地址是非常低效的，V8 转而使用隐藏类。隐藏类工作原理和静态语言中使用的固定对象布局(类)相似，只不过隐藏类是在运行时生成的，而静态语言是在编译时生成。
现在，让我们看看他们的样子：

function Point(x, y) {
  this.x = x;
  this.y = y;
}

var p1 = new Point(1, 2);

一旦调用"new Point(1,2)" ，V8 创建一个叫做 "C0" 的隐藏类。

此时还没有为类 Point 创建属性，所以 "C0" 是空的。

一旦第一条语句 "this.x = x" 开始执行(在 Point 函数中), V8 将会基于 "C0" 创建第二个隐藏类。"C1"指向了可以找到 x 属性的内存地址(相当于对象指针)。
本例中，"x" 存储在位移为 0 的地址中，这意味着当以连续缓冲区来内存中查看point对象的时候，位移起始处即和属性 "x" 保持一致。V8 将会使用 "类转换" 来更新 "C0"，"类转换" 表示如果属性 "x" 是否被添加进point对象，隐藏类将会从 "C0" 切换为"C1"。
以下的点对象的隐藏类现在是 "C1"。

每当对象添加新的属性，使用转换路径来把旧的隐藏类更新为新的隐藏类。隐藏类转换是重要的，它们使得用同样方式创建的对象可以共享隐藏类。如果两个对象共享一个隐藏类并且两个对象添加了相同的属性，隐藏类转换会确保两个对象收到相同的新的隐藏类，并且确保所有的优化过的代码都会包含这些新的隐藏类。

当运行 "this.y = y" 语句的时候，会重复同样的过程(还是在 Point 函数中，在 "this.x = x" 语句之后)。

新建了一个 "C2" 的隐藏类，一个类转换被添加进 "C1" 中，表示属性 "y" 如果被添加进point对象之后隐藏会更改为 "C2"，然后ponit对象的隐藏类会更新为 "C2"。

隐藏类转换依赖于属性被添加进对象的顺序。看如下的代码片段：

function Point(x, y) {
  this.x = x;
  this.y = y;
}

var p1 = new Point(1, 2);
p1.a = 5;
p1.b = 6;

var p2 = new Point(3, 4);
p2.b = 7;
p2.a = 8;

你可能会以为 p1 和 p2 会使用相同的隐藏类和类转换。然而， "p1"先添加属性 "a" 然后再添加属性 "b"。"p2"，先添加属性 "b" 然后是 "a"。因为使用不同的转换路径，所以"p1" 和 "p2" 会使用不同的隐藏类。所以，更好的方法是以相同的顺序初始化动态属性以便于复用隐藏类。

内联缓存

V8 使用的另一项优化动态类型语言的技术叫做内联缓存。内联缓存依赖于这样一个观察，相同类型的对象往往会有相同方法的重复调用。这里有一份深入阐述内联缓存的文章。

先讲一下内联缓存的大概概念(万一你还不是很了解)。

它是如何工作的呢？

V8 会维护一份对象类型的缓存，这个对象类型是最近被调用的函数的入参类型。V8使用这份信息假设在未来某个时候这个对象类型将会被再次传入这个函数，这样它就可以绕过寻找访问该对象属性的过程，代之以使用已经储存起来的对象隐藏类的信息。

那么隐藏类和内联缓存是如何联系在一起的呢？

每当在一个指定的对象上调用对象里的方法的时候，V8 引擎不得不执行查找对象隐藏类的操作，用来取得指定属性对应的位移。在两次成功调用相同隐藏类的相同方法之后，V8 就会忽略隐藏类的查找并且只是简单地把属性的位移添加给对象指针的起始位置上。之后所有对这个方法的调用，V8 引擎假设隐藏类没有改变，然后使用之前查找到的位移来直接跳转到指定属性的内存地址。这极大地提升了代码运行速度。

内存缓存也是为什么同样类型的对象共享隐藏类是如此重要的原因。当你创建了两个同样类型的对象而使用不同的隐藏类(正如之前的例子所做的那样)，V8 将不可能使用内存缓存，因为即使相同类型的两个对象，他们对应的隐藏类为他们的属性分派不同的地址位移。

这两个对象基本上是一样的但是创建 "a" 和 "b" 的顺序是不同的

编译为机器码

一旦优化了 Hydrogen 图表，Crankshaft 会把它降级为低级的展现叫做 Lithium。大多数 Lithium 的实现都是依赖于指定的架构的。寄存器分配发生在这一层。

最后，Lithium 会被编译为机器码。之后被称为 OSR（什么是OSR）的事情发生了：运行时栈替换。在开始编译和优化一个耗时明显的方法之前，极有可能去运行OSR。V8 不会忘记代码执行缓慢的地方，再次运行时就会调用优化过的版本。它会转换所有的上下文(堆栈，寄存器)，这样就可以在执行过程中切换到优化的版本代码。这是一个复杂的任务，你只需要记住的是，在其它优化过程中，V8 会初始化内联代码。

这里还有被称为逆优化的安全防护，以防止当引擎所假设的事情没有发生的时候，可以进行逆向转换和把代码反转为未优化的代码。

垃圾回收

V8 使用传统的标记-清除技术来清理旧内存以进行垃圾回收。标记阶段会中止 JavaScript 的运行。
为了控制垃圾回收的成本并且使得代码执行更加稳定，V8 使用了增量标记法：不遍历整个内存堆去试图标记每个可能的对象，它只是遍历一部分堆，然后重启正常的代码执行。下一个垃圾回收点将会从上一个堆遍历中止的地方开始执行。这会在正常的代码执行过程中有一个非常短暂的间隙。之前提到过，清除阶段是由单独的线程处理的。

Ignition 和 TurboFan

随着 2017 早些时候 V8 5.9 版本的发布，带来了一个新的执行管道。新的管道获得了更大的性能提升，在现实 JavaScript 程序中也显著地节省了内存。

新的执行管道是建立在新的 V8 解释器 Ignition 和 V8 最新的优化编译器 TurboFan 之上的。

你可以查看 V8 小组的博文。

自从 V8 5.9 版本发布以来，full-codegen 和 Crankshaft(V8 从 2010 开始使用至今) 不再被 V8 用来运行JavaScript，因为 V8 小组正努力跟上新的 JavaScript 语言功能以及为这些功能做优化。

这意味着接下来整个 V8 将会更加精简和更具可维护性。

网页和 Node.js benchmarks 评分的提升

这些提升只是一个开始。新的 Ignition 和 TurboFan 管道会为未来的优化作铺垫，它会在未来几年内提升 JavaScript 性能，减少 Chrome 和 Node.js 中的 V8 痕迹。

最后，这里有一些如何写出优化良好的，更好的 JavaScript 代码。如果你看懂了上面的帖子，可能自己就能总结一些出来

如何写优化的 JavaScript 代码

对象属性有序化：总是以相同的顺序实例化对象属性，这样隐藏类及之后的优化代码都可以被共享。
动态属性：实例化之后为对象添加属性会致使为之前隐藏类优化的方法变慢。相反，在对象构造函数中赋值对象的所有属性。
方法：重复执行相同方法的代码会比每次运行不同的方法的代码更快(多亏了内联缓存)。
数组：避免使用键不是递增数字的稀疏数组。稀疏数组中没有包含每个元素的数列称为一个哈希表。访问该数组中的元素会更加耗时。同样地，试着避免预先分配大型数组。最好是随着使用而递增。最后，不要删除数组中的元素。这会让键稀疏。
标记值：V8 用 32 位来表示对象和数字。它使用一位来辨别是对象(flag=1)或者是被称为 SMI(小整数) 的整数(flag=0)，之所以是小整数是因为它是 31 位的。之后，如果一个数值比 31 位还要大，V8 将会装箱数字，把它转化为浮点数并且创建一个新的对象来存储这个数字。尽可能试着使用 31 位有符号数字来避免创建 JS 对象的耗时装箱操作。

单词表

标题
interpreter	解释器
obtain	获得
intermediate code	中间码
separate	独立的
former/later	前者/后者
representation	表征
in advance	提前
instantiation	实例化
retrieving	检索
computationally	计算
correspond	对应
safeguards	保障
box	装箱