这是我参与「第五届青训营 」伴学笔记创作活动的第 7 天
1 认识规则引擎
1.1 概念
规则引擎是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则,并根据业务规则做出业务决策。它有以下优点:(1) 避免重复的代码编写;(2) 业务决策与服务本身解耦,提高服务的可维护性;(3) 缩短开发路径,提高效率。
1.2 组成部分
- 数据输入:支持接受使用预定义的语义编写的规则作为策略集(接受业务的数据作为执行过程中的参数,比如价格、标签等);
- 规则理解:能够按照预先定义的词法、语法、优先级、运算符等正确理解业务规则所表达的语义;
- 规则执行:根据执行时输入的参数对策略集中的规则进行正确的解释和执行。同时对规则执行过程中的数据类型进行检查,确保执行结果正确。
1.3 应用场景
- 风控对抗:与黑灰产的对抗过程中,策略研发和产品需要能够根据黑灰产特征进行快速识别和对抗。规则引擎作为风控系统的核心,使产研人员能够不断的调整和优化对抗策略,以实现最好的风控识别效果。
- 活动策略运营:业务活动的运营需要及时根据用户效果反馈进行运营策略的优化和调整。引入规则引擎后,可以将服务代码与业务运营逻辑解耦,提高运营策略的迭代效率,方便新玩法的探索和效果验证。
- 数据分析和清洗:在数据分析系统中使用规则引擎可以便捷的实现对数据进行整理、清洗和转换。数据分析师可以根据不同的需求来自定义数据处理的规则,方便快捷的产出所需要的数据。
2 编译原理基本概念
编译原理涉及词法分析、语法分析、抽象语法树、类型检查等相关知识。
2.1 词法分析
语法分析就是把源代码字符串转换为词法单元(Token)的过程。
有限自动机(Finite-State Automation):就是一个状态机,它的状态数量是有限的。该状态机在任何一个状态,基于输入的字符,都能做一个确定的状态转换。
2.2 语法分析
语法分析就是在词法分析的基瑶上识别出表达式的语法结构的过程。
抽象语法树(Abstract Syntax Tree):表达式的语法结构可以用树来表示,其每个节点(子树)是一个语法单元,这个单元的构成规则就叫“语法”。每个节点还可以有下级节点。
- 上下文无关语法(Context-Free Grammar):语言句子无需考虑上下文,就可以判断正确性。可以使用巴科斯范式(Backus Normal Form, BNF)来表达。
- 递归下降算法(Recursive Descent Parsing):就是自顶向下构造语法树,不断对Token进行语法展开(下降),展开过程中可能会遇到递归的情况。
抽象语法树的构造过程举例:将price > 500 && ( isNewUser || userLevel > 5)构造成抽象语法树
exp : log ;
log : log ('&&' | '||') cmp | cmp
cmp : cmp '>' add | add
add : add '+' mul | mul
mul : mul '*' pri | pri
pri : const | id | (exp)
2.3 类型检查
验证执行的结果是否为合适的数据类型。在抽象语法树中,通常会验证某节点的子节点的数据类型是否合法,例如类型综合。
类型综合:根据子表达式的类型构造出父表达式的类型。例如,表达式A+B的类型是根据A和B的类型定义的。
编译时检查&运行时检查:类型检查可以发生在表达式的编译阶段(需要提前定义数据类型),即在构造语法树的阶段,也可以发生在执行时的阶段(根据参数输入值的类型)。
3 设计规则引擎
3.1 设计
设计一个规则引擎,支持特定的词法、运算符、数据类型和优先级。并且支持基于以上预定义语法的规则表达式的编译和执行。
词法(Token):
- 参数:由字母数字下划线组成 eg: _ab2、username
- 布尔值:true、false
- 字符串:"abcdefg"、'abcdefg'
- 十进制int:1234
- 十进制float:3.14
- 预定义运算符:+、-
运算符:
- 一元运算符:+、-
- 二元运算符:+、-、*、/、%、>、<、>=、<=、==、!=
- 逻辑操作符:&&、||、!
- 括号:(、)
数据类型:
- 字符串
- 布尔值
- 十进制int
- 十进制float
优先级:
| 优先级 | 运算符 |
|---|---|
| 0 | || |
| 1 | && |
| 2 | ! + - |
| 3 | > >= < <= == != |
| 4 | + - |
| 5 | * / |
| 6 | ( ) |
3.2 词法分析状态机
3.3 语法分析
expr: logOr EOF ;
logOr: logOr `||` logAnd | logAnd;
logAnd: logAnd `&&` logNot | logNot;
logNot: `!` logNot | cmp;
cmp: cmp `>` and | cmp `>=` add | cmp `<` and | cmp `<=` add | cmp `==` add | cmp `!=` add | add;
add: add `+` mul | add `-` mul | mul;
mul: mul `*` pri | mul `/` pri | mul `%` pri | pri;
pri: BoolenLiteral|IntegerLiteral|FloatLiteral|StringLiteral|Indentifier|`(`expr`)`;