了解V8执行机制,能帮助你从底层了解JavaScript,也能帮助你深入理解语言转换器Babel、语法检查工具ESLint、前 端框架Vue和React的一些底层实现机制。因此,了解V8的编译流程能让你对语言以及相关工具有更加充分的认识。
【编译器(Compiler)】【解释器(Interpreter)】【解析器】【抽象语法树(AST)】【字节码( Bytecode)】【即时编译器(JIT)】
编译器和解释器
之所以存在编译器和解释器,是因为机器不能直接理解我们所写的代码,所以在执行程序之前,需要将我们所写的代码“翻译”成机器能读懂的机器语言。按语言的执行流程,可以把语言划分为编译型语言和解释型语言。
编译型语言在程序执行之前,需要经过编译器的编译过程,并且编译之后会直接保留机器能读懂的二进制文件,这样每次运行程序时,都可以直接运行该二进制文件,而不需要再次重新编译了件,这样每次运行程序时,都可以直接运行该二进制文件,而不需要再次重新编译了。比如C/C++、GO等都是编译型语言。
而由解释型语言编写的程序,在每次运行时都需要通过解释器对程序进行动态解释和执行。比如Python、JavaScript等都属于解释型语言。
编译器
源代码 ->(惰性解析器+预计解析器)(词法分析、语法分析)->(AST、scope(静态作用域))->词义分析->中间代码->优化代码->二进制文件->直接执行->执行。
解释器
源代码 ->(惰性解析器+预计解析器)(词法分析、语法分析)->(AST、scope(静态作用域))->词义分析->字节码->解释执行->执行。
从流程中可以分析。
在编译型语言的编译过程中,编译器首先会依次对源代码进行词法分析、语法分析,生成抽象语法树(AST),然后是优化代码,最后再生成处理器能够理解的机器码。如果编译成功,将会生成一个可执行的文件。但如果编译过程发生了语法或者其他的错误,那么编译器就会抛出异常,最后的二进制文件也不会生成成功。
在解释型语言的解释过程中,同样解释器也会对源代码进行词法分析、语法分析,并生成抽象语法树(AST),不过它会再基于抽象语法树生成字节码,最后再根据字节码来执行程序、输出结果。
V8是如何执行一段JavaScript代码的?
通过上面的介绍,相信你已经了解编译器和解释器了。那接下来,我们就重点分析下V8是如何执行一段JavaScript代码的。你可以先来“一览全局”,参考下图:
从图中可以清楚地看到,V8在执行过程中既有解释器Ignition解释器Ignition,又有编译器TurboFan编译器TurboFan,那么它们是如何配合去执行一段JavaScript代码的呢?下面我们就按照上图来一一分解其执行流程。
1.生成抽象语法树(AST)和执行上下文 将源代码转换为抽象语法树抽象语法树,并生成执行上下文执行上下文
高级语言是开发者可以理解的语言,但是让编译器或者解释器来理解就非常困难了。对于编译器或者解释器来说,它们可以理解的就是AST了。所以无论你使用的是解释型语言还是编译型语言,在编译过程中,它们都会生成一个AST。这和渲染引擎将HTML格式文件转换为计算机可以理解的DOM树的情况类似。
AST转换网站
你也可以把AST看成代码的结构化的表示,编译器或者解释器后续的工作都需要依赖于AST,而不是源代码。
AST是非常重要的一种数据结构,在很多项目中有着广泛的应用。其中最著名的一个项目是Babel。Babel是一个被广泛使用的代码转码器,可以将ES6代码转为ES5代码,这意味着你可以现在就用ES6编写程序,而不用担心现有环境是否支持ES6。Babel的工作原理就是先将ES6源码转换为AST,然后再将ES6语法的AST转换为ES5语法的AST,最后利用ES5的AST生成JavaScript源代码。
除了Babel外,还有ESLint也使用AST。ESLint是一个用来检查JavaScript编写规范的插件,其检测流程也是需要将源码转换为AST,然后再利用AST来检查代码规范化的问题。
生成AST需要经过两个阶段【词法分析】【语法分析】
第一阶段是分词(tokenize),又称为词法分析,其作用是将一行行的源码拆解成一个个token。所谓tokentoken,指的是语法上不可能再分的、最小的单个字符或字符串。你可以参考下图来更好地理解什么
token。
【var】 【myName】 【=】 【""】 都被拆分成了一个个最小的token
例如 identifier 这些标识符后面会讲。
第二阶段是解析(parse),又称为语法分析,其作用是将上一步生成的token数据,根据语法规则转为AST。如果源码符合语法规则,这一步就会顺利完成。但如果源码存在语法错误,这一步就会终止,并抛出一个“语法错误”。
这就是AST的生成过程,先分词,再解析。
生成字节码
有了AST和执行上下文后,那接下来的第二步,解释器Ignition就登场了,它会根据AST生成字节码,并解释执行字节码。
V8起初并没有使用字节码,而是直接AST转机器码使用的机器码,效率很高但是在手机上内存小的就存在内存问题所以引入了字节码。AST转为机器码需要大量的内存来存储。
那什么是字节码呢?为什么引入字节码就能解决内存占用问题呢?
字节码就是介于AST和机器码之间的一种代码。但是与特定类型的机器码无关,字节码需要通过解释器将其转换为机器码后才能执行。转换为机器码后才能执行。
理解了什么是字节码,我们再来对比下高级代码、字节码和机器码,你可以参考下图:
从图中可以看出,机器码所占用的空间远远超过了字节码,所以使用字节码可以减少系统的内存使用。 关于字节码的意思和机器码的意思后面说。
执行代码
生成字节码之后,接下来就要进入执行阶段了。
通常,如果有一段第一次执行的字节码,解释器Ignition会逐条解释执行。在执行字节码的过程中,如果发现有热点代码(HotSpot),比如一段代码被重复执行多次,这种就称为热点代码热点代码,那么后台的编译器TurboFan就会把该段热点的字节码编译为高效的机器码,然后当再次执行这段被优化的代码时,只需要执行编译后的机器码就可以了,这样就大大提升了代码的执行效率。
V8的解释器和编译器的取名也很有意思。解释器Ignition是点火器的意思,编译器TurboFan是涡轮增压的意思,寓意着代码启动时通过点火器慢慢发动,一旦启动,涡轮增压介入,其执行效率随着执行时间越来越高效率,因为热点代码都被编译器TurboFan转换了机器码,直接执行机器码就省去了字节码“翻译”为机器码的过程。
其实字节码配合解释器和编译器是最近一段时间很火的技术,比如Java和Python的虚拟机也都是基于这种技术实现的,我们把这种技术称为即时编译(JIT)即时编译(JIT)。具体到V8,就是指解释器Ignition在解释执行字节的同时,收集代码信息,当它发现某一部分代码变热了之后,TurboFan编译器便闪亮登场,把热点的字节码转换为机器码,并把转换后的机器码保存起来,以备下次使用。对于JavaScript工作引擎,除了V8使用了“字节码+JIT”技术之外,苹果的SquirrelFishExtreme和Mozilla的SpiderMonkey也都使用了该技术。
这么多语言的工作引擎都使用了“字节码+JIT”技术,因此理解JIT这套工作机制还是很有必要的。你可以
结合下图看看JIT的工作过程:即时编译(JIT)技术JavaScript的性能优化JavaScript
JavaScript的性能优化
JavaScript的性能优化
到这里相信你现在已经了解V8是如何执行一段JavaScript代码的了。在过去几年中,JavaScript的性能得到了大幅提升,这得益于V8团队对解释器和编译器的不断改进和优化。
虽然在V8诞生之初,也出现过一系列针对V8而专⻔优化JavaScript性能的方案,比如隐藏类、内联缓存等概念都是那时候提出来的。不过随着V8的架构调整,你越来越不需要这些微优化策略了,相反,对于优化JavaScript执行效率,你应该将优化的中心聚焦在单次脚本的执行时间和脚本的网络下载上,主要关注以下三点内容:
1. 提升单次脚本的执行速度,避免JavaScript的⻓任务霸占主线程,这样可以使得⻚面快速响应交互; 2.内联避免大的脚本影响HTML解析速度 3.减少容量影响网络下载
V8执行时间越久,执行效率越高 V8执行越久,被编译成机器码的热点就越多,这些机器码帮助字节码可以直接执行而不用再使用解释器逐行执行,这相当于浏览器缓存,提高了执行性能。这些生成的机器码也会带来内存占用升高的问题,这里应该会有一个权衡措施吧,根据已占用的内存权衡如何判定是热点并生成机器码保存。
引入了字节码,就有弹性空间了,可以在内存和执行速度之间做调节
相比之前的V8,将JS代码全部编译成字节码,这种模式就没有协商的空间了! 其它的尽量采用异步脚本,如使用aysnc和defer 认为WebAssembly就是,WebAssembly经过TuboFan处理下就能执行了