这是我参与「第五届青训营 」伴学笔记创作活动的第 1 天
本次课从编译原理的角度切入,讲解了规则引擎是如何用状态机的形式来实现词法分析,语法分析以及抽象树的生成。
规则引擎
重点内容
1. 词法分析
词法分析顾名思义就是通过某种手段来识别并且切分源字符串中的词法单元(token),在规则引擎中,我们使用有限自动机(Finite-State Automaton)来完成具体操作。
自动机的内部流程如下图:
2. 语法分析
语法分析就是在词法分析的基础上,识别表达式的语法结构的过程。
语法分析根据一个个单词,让它们组成逻辑关系,语言规约是上下文无关语法。
如上图所示,规则引擎先通过词法分析来获取x_end, - , x_start, / , 100等token,再通过语法分析识别其具体的语法结构。
3. 抽象树的生成
最后,规则引擎基于上下文无关语法和递归下降算法来生成语法树。
知识点
1.词法分析与语法分析的区别
2.上下文无关语法
规则引擎无须依赖上下文就可以判断语句是否正确,可以用巴克斯范式来表达(BNF)。
例如email的语法可以用巴克斯范式表达为:
email ::= <name> "@" <name> "." <domain>
name ::= <alpha> | <alpha> <username>
alpha ::= <letter> | <digit> | "_"
digit ::= "0" | "1" | "2" | "3" | "4" | "5" | "6" | "7" | "8" | "9"
letter ::= "A" | "B" | "C" | "D" | "E" | "F" | "G" | "H" | "I" | "J" | "K" | "L" | "M" | "N" | "O" | "P" | "Q" | "R" | "S" | "T" | "U" | "V" | "W" | "X" | "Y" | "Z" | "a" | "b" | "c" | "d" | "e" | "f" | "g" | "h" | "i" | "j" | "k" | "l" | "m" | "n" | "o" | "p" | "q" | "r" | "s" | "t" | "u" | "v" | "w" | "x" | "y" | "z"
domain ::= "com" | "edu" | "org"
如以上例子可见,巴克斯范式通过递归的形式来限制语句的规则以确保其正确性。
3.递归下降算法
从根往下,任用产生式,进行细化的过程,直至树的叶结点不含非终结符号,仅含终结符号。
自顶向下的语法分析,最右推导,以id + id * id为例。
个人总结
通过本节课,我学习到了编译阶段的实现原理和规则引擎的原理以及其具体的实现步骤,并体会到了从0开始设计一个规则引擎的过程。