编译原理基本概念 | 青训营

44 阅读3分钟

这是我参与「第五届青训营 」笔记创作活动的第十天

一、本堂课重点内容:

  • 词法分析
  • 语法分析
  • 抽象语法树
  • 类型检查

二、详细知识点介绍:

一个程序从程序员编写完到编译成为机器可以识别的字节码,中间经历了很多。

首先,肯定会经过词法分析、语法分析、语义分析等操作,把源代码转换为词法单元Token且识别出表达式的语法结构,然后通过构建出抽象语法树以此来确定表达式的执行,最后通过参数注入、类型检查等操作,来验证执行的结果是否为合适的数据类型。

接下来详细分析一下

词法分析

词法分析就是把源代码字符串转换为词法单元Token的这个过程。

具体是什么意思呢?其实很好理解,就像是我们初中做文言文时经常会碰到的题目,如何给一串文言文断句从而正确理解这句文言文的意思。 image.png 那么,我们如何去识别一个词法单元呢?

这时就得提到一个东西了———有限自动机

有限自动机就是一个状态机,它的状态数量是有限的。该状态机在任何一个状态,基于输入的字符,都能做一个确定的状态转换。

这是有限状态机的大概概念,听起来迷迷糊糊的。

在我的理解来看,就是这个有限状态机会判断每一个字符的定义,如果这个字符和前面读取的字符是不同状态的即不同属性的,那么它就会跳出这个状态转变成另一个你之前就设定好的状态

OK!基于有限状态机我们就可以把一段源代码就可以拆分成一个个词法单元。

语法分析与抽象语法树

语法分析就是在词法的基础上,识别表达式的语法结构的过程

表达式的语法结构可以用树来表示,其每个节点(子树)是一个语法单元,这个单元的构成规则就叫“语法”。每个节点还可以有下级节点。

其中抽象语法树中有上下文无关语法和递归下降算法

上下文无关语法指的是语言句子无需考虑上下文,就可以判断正确性。可以使用巴科斯范式(BNF)来表达 产生式:一个表达式可以由另外的已知类型的表达式或者符号推导产生

而递归下降算法就是自顶向下构造语法树,不断的对Token进行语法展开(下降),展开过程中可能会遇到递归的情况。

类型检查

类型综合:根据子表达式的类型构造出父表达式的类型。

而且类型检查可以发生在表达式的编译阶段,即在构造语法树的阶段;也可以发生在执行时的阶段

  • 编译时:需要提前声明参数的类型,在构建语法树的过程中进行类型检查
  • 执行时:可以根据执行时的参数输入的值类型,在执行过程中进行类型检查

三、课后个人总结:

这次学到了一些关于编译原理的一些知识,这是比较底层的一些知识了, 可能刚开始听起来有点懵但是对底层的了解是一个程序员的基本素质与修养, 所以,还是非常受益的。