这是我参与「第五届青训营 」伴学笔记创作活动的第 13 天。
规则引擎涉及与实现
这章会介绍规则引擎的组成部分、核心原理和应用场景,并实现一个规则引擎案例-YoungEngine,再结合之前课程自行实现一个web版规则引擎。
认识规则引擎
规则引擎是一种嵌入在应用程序中的组件,将业务决策从应用程序中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则,并根据业务规则做出业务决策。它解决了开发人员重复编码的问题,提高服务的可维护性,缩短开发路径,提高效率。
组成部分
- 数据输入:支持接受使用预定义的语义编写规则作为策略集,比如“price>50000000”接受业务的数据作为执行过程中的参数,如价格、标签等。
- 规则理解:能按照预先定义的词法、语法、优先级、运算符等正确理解业务规则所表达的语义
- 规则执行:根据执行时输入的参数对策略集中的规则进行正确的解释和执行。同时对规则执行过程中的数据类型进行检查,确保执行结果正确。
应用场景
规则引擎可应用于风控对抗、活动策略运营、数据分析和清洗。
编译原理基本概念
规则引擎的编译原理步骤为:
- 理解:词法分析、语法分析
- 执行:抽象语法树
- 输入输出:参数注入、类型检查
词法分析
把源代码字符串通过有限自动机转换为词法单元(Token)过程。
语法分析
在词法分析基础上,识别表达式的语法结构的过程。
抽象语法树
表达式的语法结构可以用树表示,每个节点是一个语法单元,这个单元的构成规则就叫“语法”,每个节点还可以有下级节点。
类型检查
- 类型综合:根据子表达式的类型构造出父表达式的类型。例如,表达式A+B的类型定义的
- 编译时检查&运行时检查
类型检查可以发生在表达式的编译阶段,即在构造语法树的阶段,也可以发生在执行时的阶段:
- 编译时:需提前声明参数的类型,在构建语法树过程进行类型检查。
- 执行时:可以根据执行时的参数输入的值类型,在执行过程中进行类型检查
设计一个规则引擎
设计目标
设计一个规则引擎,支持特定的词法、运算符、数据类型、和优先级。并支持基于以上预定义语法的规则表达式的编译和执行。
- 词法(合法Token):
-
数据类型:字符串、布尔值、十进制int、十进制float
-
运算符:
- 优先级
词法分析
参数:由字母数字下划线组成(_ab2, user_name)
布尔值:true false
字符串:“abcd”
十进制int:1111
十进制float:111.11
一元运算符:+ -
二元运算符:+ - * / % > < >= <= == !=
逻辑操作符:&& || !
括号:( )
语法分析
优先级的表达
语法树结构
一元运算符:左子树为空,右子树为右操作数
二元运算符:左子树为左操作数,右子树为右操作数
括号:左子树为空,右子树为内部表达式的AST
语法树执行与类型检查
-
语法树执行:预先定义好每种操作符的执行逻辑,对抽象语法树进行后序遍历。
-
类型检查:在执行时检查,并在一个节点的左右子节点执行完成后,分别校验左右子节点的类型是否符合对应操作符的类型检查预设规则,例如:
- ‘>’ 符号要求左右节点的值都存在且为int或float。
- ‘!’符号要求左节点为空且有节点的值为bool