理解引擎、编译器和作用域如何协同工作

1,840 阅读4分钟

前言

最近在看《YOU DON’T KNOW JS》一书,里面讲到关于作用域的理解。我将文中主要内容整理成笔记,并加上一些自己的一些理解,汇成此文。

关于引擎、编译器和作用域

  • 引 擎 从头到尾负责整个js程序的编译及执行过程
  • 编译器 负责语法分析及代码生成
  • 作用域 负责收集并维护所有声明的标识符(变量)组成的一系列查询,并实施一套非常严格的规则,确定当前执行的代码对这些标识符的访问权限

那三者之间是怎么协同工作的呢?

事实上,当变量执行赋值操作时,会执行两个动作:

  1. 首先编译器会在当前作用域中声明一个变量(如果之前没有声明过)
  2. 然后在运行时引擎会在作用域中查找该变量,如果能够找到就会对它赋值,否则引擎就会举手示意并抛出一个异常

关于LHS和RHS查询

我们上面提到,编译器主要负责语法分析及代码生成。在生成了引擎运行的代码时,引擎会通过查找变量来判断它是否已声明过,查找的过程由作用域进行协助,但是引擎执行怎样的查找,涉及到两种查找方式:

  1. LHS查询 变量出现在赋值操作的左侧时进行LHS查询,试图找到变量的容器本身,从而可以对其赋值

  2. RHS查询 同理,变量出现在右侧进行RHS查询,仅仅简单地查找某个变量的值

讲得更精准一点,RHS查询与简单地查找某个变量的值一样,而LHS查询则是找到变量的容器本身,从而可以对其赋值。需要注意的是,LHS和RHS的含义是“赋值操作的左侧或者右侧”,并不意味着就是“=赋值操作符的左侧或者右侧”,赋值操作还有其他几种形式,因此在概念上最好将其理解为“赋值操作的目标是谁(LHS)”以及“谁是赋值操作的源头(RHS)”

关于引擎和作用域的一个对话

举个例子

function foo(a) {
console.log( a ); 
}
foo( 2 );

让我们把上面这段代码的处理过程想象成一段对话,这段对话可能是下面这样:

引擎:我说作用域,我需要为 foo 进行RHS引用。你见过它吗?

作用域:别说,我还真见过,编译器那小子刚刚声明了它。它是一个函数,给你。

引擎:哥们太够意思了!好吧,我来执行一下 foo 。

引擎:作用域,还有个事儿。我需要为 a 进行LHS引用,这个你见过吗?

作用域:这个也见过,编译器最近把它声名为 foo 的一个形式参数了,拿去吧。

引擎:大恩不言谢,你总是这么棒。现在我要把 2 赋值给 a 。

引擎:哥们,不好意思又来打扰你。我要为 console 进行RHS引用,你见过它吗?

作用域:咱俩谁跟谁啊,再说我就是干这个。这个我也有, console 是个内置对象。给你。

引擎:么么哒。我得看看这里面是不是有 log(..) 。太好了,找到了,是一个函数。

引擎:哥们,能帮我再找一下对 a 的RHS引用吗?虽然我记得它,但想再确认一次。

作用域:放心吧,这个变量没有变动过,拿走,不谢。

引擎:真棒。我来把 a 的值,也就是 2 ,传递进 log(..)

捋一捋

为了搞清晰引擎、编译器和作用域三种的关系,我从JS代码开始捋

通常我们通过编辑器写完JS代码,在JS代码执行前,首先由编译器进行词法、语法分析。通篇扫描一遍看是否有错误,有错误,程序终止,没有错误则继续。继续则由引擎将JS代码编译成不同 CPU对应的汇编代码,编译后,引擎会一行一行执行编译后的代码,在执行代码时,引擎会不断的与作用域进行“交流”。

但是这里我有一点迷惑,就是JS预编译发生在哪里?求解

个人目前猜想,是由编译器进行预编译的

基于理由:从名字可以知道,编译发生在编译之前

如果真是这样。那整个过程应该是这样:

在JS代码执行前,首先由编译器进行词法、语法分析。通篇扫描一遍看是否有错误,有错误,程序终止,没有错误则继续进行预编译工作,方便一会引擎去执行代码,需要注意,预编译同时会产生JS作用域的具体表现--[[scope]]。

预编译结束后,则由引擎将JS代码编译成不同 CPU对应的汇编代码,编译后,引擎会一行一行执行该代码,此执行过程,引擎会不断的与作用域进行“交流”。

以上就是我理解的大致过程,有误之处,烦请告知!

参考资料

《YOU DON’T KNOW JS》上卷