the-super-tiny-compiler / 超级微小的编译器
此部分 the-super-tiny-compiler / 超级微小的编译器 内容,均摘取自 the-super-tiny-compiler-CN,先看完 the-super-tiny-compiler-CN 才有看后续的意义。
概要
大部分编译器的工作可以被分解为三个主要阶段:解析(Parsing),转化(Transformation)以及 代码生成(Code Generation)
- 解析 将源代码转换为一个更抽象的形式。
- 转换 接受解析产生的抽象形式并且操纵这些抽象形式做任何编译器想让它们做的事。
- 代码生成 基于转换后的代码表现形式(code representation)生成目标代码。
解析
- 词法分析 —— tokenizer 通过一个叫做tokenizer(词素生成器,也叫lexer)的工具将源代码分解成一个个词素。(词素是描述编程语言语法的对象。它可以描述数字,标识符,标点符号,运算符等等。)
- 语法分析 —— parser 接收词素并将它们组合成一个描述了源代码各部分之间关系的中间表达形式:抽象语法树。(抽象语法树是一个深度嵌套的对象,这个对象以一种既能够简单地操作又提供很多关于源代码信息的形式,来展现代码。)
转换
编译器的下一个阶段是转换阶段。再回顾一遍,这个过程接收解析生成的抽象语法树并对它做出改动。转换阶段可以改变抽象语法树使代码保持在同一个语言(例如Babel,Babel接收的是JS代码生成的也是JS代码),或者编译成另外一门语言。
traverser函数,这个函数接收抽象语法树以及一个访问者对象
transformer -> traverser(ast, visitor)
接收创造的抽象语法树并将它和一个访问者对象传给 traverser 函数。然后创造一个新的抽象语法树
代码生成
codeGenerator 生成新的代码
babel 是如何工作的?
- 解析 —— @babel/parser(包含 上方提到的 tokenizer、parser),根据 es2015, es2016... 标准,生成 AST
- 转换 —— @babel/traverse + plugins (visitor)
- 代码生成 —— @babel/generator
AST 定义
AST 生成工具 (parser)
- esprima —— 老牌解析器
- acorn —— esprima 后的轮子,目前使用最多。webpack 也使用此工具
- astexplorer —— 在线生成工具
- espree —— 最初从 esprima fork 出来,来自 eslint,用于 eslint
- babel-parser —— 原 babylon,最初 从 acorn fork 出来
- UglifyJS2 —— 自带 parser
- shift-parser-js —— 自己定义了一套 AST 规范 shift-spec
其他 AST 转换工具 (transformer)
- estraverse
- ...
代码生成工具 (codeGenerator)
- escodegen
- ...
其他编译工具
- traceur-compiler
- ...
基于 AST 的工具
如上所描述:
- eslint
- webpack
- UglifyJS 代码压缩
- prettier —— 使用 @babel/parser、angular-estree-parser... etc.
- typescript —— 自带 parser、transformer、codeGenerator
- 代码重构
- 其他,例如:IDE 错误提示、格式化、高亮、自动补全 等
- ...