这是我参与「第五届青训营 」伴学笔记创作活动的第 8 天
Day08——规则引擎设计与实现
01.认识规则引擎
简介:
规则引擎是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则,并根据业务规则做出业务决策。
优点:业务决策与服务本身解耦,提高服务的可维护性缩短开发路径,提高效率
组成部分:
1.数据输入:支持接受使用预定义的语义编写的规则作为策略集。比如
price > 500 ,接受业务的数据作为执行过程中的参数,比如价格、标签等
2.规则理解:能够按照预先定义的词法、语法、优先级、运算符等正确理解业务规则所表达的语义。
3.规则执行:根据执行时输入的参数对策略集中的规则进行正确的解释和执行。同时对规则执行过程中的数据类型进行检查,确保执行结果正确
应用场景
- 风控对抗:与黑灰产的对抗过程中,策略研发和产品需要能够根据黑灰产特征进行快速识别和对抗。规则引擎作为风控系统的核心,使产研人员能够不断的调整和优化对抗策略,以实现最好的风控识别效果。
- 活动策略运营:业务活动的运营需要及时根据用户效果反馈进行运营策略的优化和调整。引入规则引擎后,可以将服务代码与业务运营逻辑解耦,提高运营策略的迭代效率。方便新玩法的探索和效果验证
- 数据分析和清洗:在数据分析系统中使用规则引擎可以便捷的实现对数据进行整理、清洗和转换。数据分析师可以根据不同的需求来自定义数据处理的规则,方便快捷的产出所需要的数据。
02.编译原理基本概念
2.1 词法分析
词法分析就是把源代码字符串转换为词法单元(Token)的这个过程。
类似于把一句话按主谓宾切分
识别token依靠有限自动机,做确定的状态转换
2.2 语法分析
语法分析就是在词法分析的基础上,识别表达式的语法结构的过程
比如,识别price为左操作数参数,大于号为操作符,500为右操作数
抽象语法树:表达式的语法结构可以用树来表示,其每个节点(子树)是一个语法单元,这个单元的构成规则就叫“语法”。每个节点还可以有下级节点。
上下文无关语法:语言句子无需考虑上下文,就可以判断正确性。
如:r := a > b
可以 使用巴克斯范式表达
产生式:一个表达式可以由另外已知类型的表达式或者符号推导产生
一个基础表达式可以由常量(string. bool、number)或标识符
一个乘法表达式可以由基础表达式或者乘法表达式*基础表达式组成
递归下降算法:自顶向下构造语法树,不断对token进行语法树下降,展开过程可能遇到递归的情况
接受一个流,根据我们定义的匹配的规则,将每个符号自上而下依次匹配规则,直到匹配到符合的规则,则可以确定符号的含义
然后将中间的推导过程省略连线,即可得到语法树
即上图的右边的树
2.3 类型检查
1.类型综合
根据子表达式的类型构造出父表达式的类型,例如,表达式A+B的类型是根据A和B的类型定义的
比如左边可以根据A+B的运算结果推出表达式是布尔型,但是右边无法单单根据A或B进行推导,会报错
2.编译时检查&运行时检查
类型检查可以发生在表达式的编译阶段,即在构造语法树的阶段;也可以发生在执行时的阶段
编译时:需要提前声明参数的类型,在构建语法树过程中进行类型检查
在构建时即发现类型不对,会直接报错
执行时:可以根据执行时的参数输入的值类型,在执行过程中进行类型检查
03.设计一个规则引擎
1.设计目标
设计一个规则引擎,支持特定的词法、运算符、数据类型和优先级。并且支持基于以上预定义语法的规则表达式的编译和执行。
词法:
数据类型:
运算符:
运算优先级:
2.词法分析
词法分析的状态机设计:
3.语法分析
预先定义的巴克斯范式,定义规则
这里逻辑运算符根据优先级做了拆分
优先级的表达:
语法树结构:
一元运算符:左子树为空,右子树为右操作数
二元运算符:左子树为左操作数,右子树为右操作数括号:左子树为空,右子树为内部表达式的AST
4.语法树的执行与类型检查
语法树的执行
就是对树的后序遍历,先执行左子树,得到左节点的值;再执行右子树,得到有节点的值,最后根据根节点的操作符执行得到根节点的值。
类型检查
此处采用运行时检查
检查方法是在一个节点的左右子节点执行完成后,分别校验左右子节点的类型是否符合对应操作符的类型检查预设规则。
比如‘>'符号要求左右子节点的值都存在且为int或float.