这是我参与「第五届青训营 」伴学笔记创作活动的第 9 天 课程内容为:规则引擎设计与实现。
编译原理基本概念
词法分析 语法分析 抽象语法树 类型检查
词法分析
词法分析就是把源代码字符串转换为词法单元(Token)的这个过程。
如何识别Token ?有限自动机(Finite-State Automaton)
有限自动机就是一个状态机,它的状态数量是有限的。该状态机在任何一个状态,基于输入的字符,都能做一个确定的状态转换。
语法分析
语法分析就是在词法分析的基础上,识别表达式的语法结构的过程。
抽象语法树:表达式的语法结构可以用树来表示,其每个节点(子树)是一个语法单元,这个单元的构成规则就
叫“语法”。每个节点还可以有下级节点。
抽象语法树
上下文无关语法
r:=a>b
语言句子无需考虑上下文,就可以判断正确性。可以使用巴科斯范式(BNF)来表达
exp:add;
add :add'+'mul | mul; //加法表达式 a+b+ c a+b*c
mul : mul '*' pri | pri; //乘法表达式 a*b*c
pri:string |bool|number|identifer; //基础表达式 weight|20|"abcde"
产生式:一个表达式可以由另外已知类型的表达式或者符号推导产生
内置符号:字面量(string、bool、number) 标识符、运算符
一个基础表达式可以由 常量(string、bool、number)或标识符(identifier)
一个乘法表达式可以由 基础表达式 或者 乘法表达式*基础表达式组成
.....
递归下降算法
递归下降算法就是自顶向下构造语法树
不断的对Token进行语法展开(下降),展开过程中可能会遇到递归的情况。
类型检查
类型综合
根据子表达式的类型构造出父表达式的类型。例如,表达式A+B的类型是根据A和B的类型定义
编译时检查 & 运行时检查
类型检查可以发生在表达式的编译阶段,即在构造语法树的阶段;也可以发生在执行时的阶段
编译时:需要提前声明参数的类型,在构建语法树过程中进行类型检查
int1 :int; str1 :string
执行时:可以根据执行时的参数输入的值类型,在执行过程中进行类型检查
int1:108;str1:"300"
设计一个规则引擎
设计目标 词法与语法 优先级与语法树
设计目标
设计一个规则引擎,支持特定的词法、运算符、数据类型和优先级。并且支持基于以上预定义语法的规则表达式的编译和执行。
词法(合法Token)
参数:由字母数字下划线组成 eg:_ab2、user name
布尔值:true、false
字符串:“abcd”、’abcd’、'abcd'
十进制int:1234
十进制float:123.5
预定义运算符:+-
数据类型
字符串
布尔值
十进制int
十进制float
语法树执行与类型检查
语法树执行
预先定义好每种操作符的执行逻辑。
对抽象语法树进行后续遍历执行,即:
先执行左子树,得到左节点的值;
执行右子树,得到有节点的值;
最后根据根节点的操作符执行得到根节点的值。
类型检查
检查时机:执行时检查
检查方法:在一个节点的左右子节点执行完成后,分别校验左右子节点的类型是否符合对应操作符的类型检查预设规则
'>'符号要求左右子节点的值都存在且为 int或float
'!'符号要求左节点为空且右节点的值为 bool