这是我参与「第五届青训营 」伴学笔记创作活动的第 6 天
一、本堂课重点内容
- 规则引擎的设计
- 规则引擎的实现
- 规则引擎的核心原理
二、详细知识点介绍
认识规则引擎
规则引擎的定义
规则引擎是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则,并根据业务规则做出业务决策。
组成部分
- 数据输入
- 规则理解
- 规则执行
应用场景
- 风控对抗
- 活动运营策略
- 数据分析和清洗
编译原理基本概念
规则引擎是基于编译原理设计的,首先通过词法分析语法分析分析字符串,转换为token串并且识别语法结构,之后生成抽象语法树用于执行,最后进行参数注入和类型检查完成整个流程。
词法分析
词法分析就是把源代码字符串转换为词法单元(Token)的这个过程。
语法分析
语法分析就是在词法分析的基础上,识别表达式的语法结构的过程。
表达式的语法结构可以用树来表示,其每个节点(子树)是一个语法单元,这个单元的构成规则就叫”语法”。每个节点还可以有下级节点。
抽象语法树
上下文无关语法
语言句子无需考虑上下文,就可以判断正确性。可以使用巴科斯范式(BNF)来表达
递归下降算法
递归下降算法就是自顶向下构造语法树,不断地对Token进行语法展开,展开过程中可能会遇到递归的情况。
类型检查
类型综合
根据子表达式的类型构造出父表达式的类型。
编译时检查&运行时检查
类型检查可以发生在表达式的编译阶段,即在构造语法树的阶段,也可以发生在执行时的阶段。
- 编译时: 需要提前声明参数的类型,在构建语法树过程中进行类型检查
- 执行时: 可以根据执行时的参数输入的值类型,在执行过程中进行类型检查
设计一个规则引擎
设计目标
设计一个规则引擎,支持特定的词法、运算符、数据类型和优先级。并且支持基于以上预定义语法的规则表达式的编译和执行。
词法分析
要定义好各种token和运算符后,设计类似于下图所示的词法分析的状态机,理清逻辑,便于之后的程序编写。
语法分析
在语法分析部分,首先最好写出语法分析的表达式,表达式中不仅包含了语法的详细解释还蕴含了各个语法之间的优先级关系。
优先级表达
定义数据结构表达各个语法的优先级关系。
定义语法树结构
- 一元运算符:左子树为空,右子树为右操作数
- 二元运算符:左子树为左操作数,右子树为右操作数
- 括号:左子树为空,右子树为内部表达式的AST
语法树执行与类型检查
语法树执行
预先定义好每种操作符的执行逻辑。对抽象语法树进行后续遍历执行,即:先执行左子树,得到左节点的值;再执行右子树,得到有节点的值;最后根据根节点的操作符执行得到根节点的值。
类型检查
- 检查时机:执行时检查
- 检查方法:在一个节点的左右子节点执行完成后,分别校验左右子节点的类型是否符合对应操作符的类型检查预设规则。
三、实践练习例子
实践例子可参考qimengxingyuan/young_engine: 简单的规则引擎 (github.com)
词法
词法状态机:
语法
优先级:
四、课后个人总结
这是我首次学习规则引擎的相关知识,个人认为有一定难度,尤其是编译原理部分的知识已经有些遗忘,所以项目的个别实现部分例如语义分析这里有些困难,需要进行进一步学习,课上给出的项目也需要进一步吸收掌握,争取能够实现作业中的web引擎。