这是我参与「第五届青训营 」伴学笔记创作活动的第 9 天
规则引擎
规则引擎简介
定义
规则引擎是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。
接受数据输入,解释业务规则,并根据业务规则做出业务决策。
优势
- 解决开发人员重复编码的问题
- 业务决策与服务本身解耩,提高服务的可维护性
- 缩短开发路径,提高效率
组成
-
数据输入
支持接受使用预定义的语义编写的规则作为策略集。比如 "price > 500" 接受业务的数据作为执行过程中的参数,比如价格、标签等。 -
规则理解
能够按照预先定义的词法,语法、优先级、运算符等正确理解业务规则所表达的语义。 -
规则执行
根据执行时输入的参数对策略集中的规则进行正确的解释和执行。同时对规则执行过程中的数据类型进行检查,确保执行结果正确。
应用
- 风控对抗
与黑灰产的对抗过程中,策略研发和产品需要能够根据黑灰产特征进行快速识别和对抗。规则引擎作为风控系统的核心,使产研人员能够不断的调整和优化对抗策略,以实现最好的风控识别效果- 活动策略运营
业务活动的运营需要及时根据用户效果反馈进行运营策略的优化和调整引入规则引擎后,可以将服务代码与业务运营逻辑解轉,提高运营策略的迭代效率。方便新玩法的探索和效果验证- 数据分析和清洗
在数据分析系统中使用规则引擎可以便捷的实现对数据进行整理、清洗和转换。数据分析师可以根据不同的需求来自定义数据处理的规则,方便快捷的产出所需要的数据。
规则引擎设计
设计目标
设计一个规则引擎,支持特定的词法、运算符、数据类型和优先级。并且支持基于以上预定义语法的规则表达式的编译和执行。
词法 (合法 Token )
- 参数:由字母数字下划线组成
eg:_ab2、user_ name - 布尔值:
true、talse - 字符串:"abcd"、'abcd'、`abcd`
- 十进制 int:1234
- 十进制 float:123.5
- 预定义运算符:+ -
数据类型
- 字符串
- 布尔值
- 十进制 int
- 十进制 float
运算符
- 一元运算符:
+ - - 二元运算符:
+ - * / % > < >= <= == != - 逻辑运算符:
&& || !
优先级
| 优先级 | 运算符 |
|---|---|
| 0 | || |
| 1 | && |
| 2 | ! - + |
| 3 | > < >= <= == != |
| 4 | + - |
| 5 | * / |
| 6 | ( ) |
词法分析
设计词法分析的状态机
语法分析
expr: logOr EOF;
logOr: logOr '||' logAnd | logAnd;
logAnd: logAnd '&&' logNot | logNot;
logNot: '!' logNot | cmp;
cmp: cmp '>' add | cmp '>=' add | cmp '<' add | cmp '<=' add | cmp '==' add | cmp '!=' add | add;
add: add '+' mul | add '-' mul mul;
mul: mul '*' pri | mul '/' pri | mul '%' pri | pri;
pri: BooleanLiteral|IntegerLiteral|FloatLiteral|StringLiteral|Identifier|'('expr')';
优先级的表达
type precedence struct {
validSymbols []Symbol // 当前优先级支持的运算符类型
nextPrecedence *predence // 更高优先级的
planner plannner // 当前优先级的处理函数
}
语法树结构
一元运算符:左子树为空,右子树为右操作数
二元运算符:左子树为左操作数,右子树为右操作数 0
括号:左子树为空,右子树为内部表达式的 AST
语法树执行
预先定义好每种操作符的执行逻辑。对抽象语法树进行后续遍历执行,即:
- 先执行左子树,得到左节点的值;
- 再执行右子树,得到有节点的值;
- 最后根据根节点的操作符执行得到根节点的值。
类型检查
检查时机:执行时检查 或 编译时检查
检查方法:在一个节点的左右子节点执行完成后,分别校验左右子节点的类型是否符合对应操作符的类型型检查预设规则。
- '>' 符号要求左右子节点的值都存在且为 int 或 float。
- '!' 符号要求左节点为空且右节点的值为 bool。