这是我参与「第五届青训营 」伴学笔记创作活动的第 7 天,今天主要学习的是规则引擎,了解规则引擎的概念和相关知识。
规则引擎是一种嵌入在应用服务中的组件,可以将灵活多变的业务决策从服务代码中分离出来。通过使用预定义的语义模块来编写业务逻辑规则。在执行时接受数据输入、解释业务规则,并做出决策。规则引擎能大大提高系统的灵活性和扩展性。
背景
在没有规则引擎之前,我们的设计方案是这样的
业务人员在修改决策规则之后交给开发人员进行代码开发来实现业务逻辑,但是这样就会带来以下几个问题:
- 重复编码:对于一些简单的需求,只是在不断的进行重复开发
- 项目完成之后需要不断上线,测试
- 一个需求的开发可能需要半天的时间,等开发出来的时候花都谢了
引入规则引擎之后就变成这样
带来的几个好处
- 解决开发人员重复编码问题
- 业务与服务解耦,提高服务的可维护性
- 缩短开发路径,提高效率
规则引擎的组成
主要包含数据输入、规则理解、规则执行等几个方面
数据输入:
-
支持接受使用预定义的语义编写的规则作为策略集。比如 " price > 500 "
-
支持接受业务的数据作为执行过程中的参数,比如价格、标签等
规则理解:
- 能够按照预先定义的词法、语法、优先级、运算符等正确理解业务规则所表达的语义。
规则执行:
- 根据执行时输入的参数对策略集中的规则进行正确的解释和执行。同时对规则执行过程中的数据类型进行检查,确保执行结果正确。
应用场景
风控对抗
与黑灰产的对抗过程中,策略研发和产品需要能够根据黑灰产特征进行快速识别和对抗。规则引擎作为风控系统的核心,使产研人员能够不断地调整和优化对抗策略,以实现最好的风控识别效果。
活动策略运营
业务活动的运营需要及时根据用户效果反馈进行运营策略的优化和调整,引入规则引擎后,可以将服务代码与业务运营逻辑解耦,提高运营策略的迭代效率。方便新玩法的探索和效果验证。
数据分析和清洗
在数据分析系统中使用规则引擎可以便捷的实现对数据进行整理、清洗和转换。数据分析师可以根据不同的需求来自定义数据处理的规则,方便快捷的产出所需要的数据。
编译原理的基本概念
主要包括词法分析、语法分析、抽象语法数、类型检查等
词法分析
把字符串转化为词法单元token的过程
比如,输入上面的一行字符串,将他解析为一个一个单元组成的句子
那么,怎么把他转化为一个由单词构成的句子呢
我们可以使用有限自动机Finite-State Automaton这个东西
有限自动机是一个状态机,它的状态数量是有限的。该状态机在任何一个状态,基于输入的字符,都能做一个确定的状态转换。 如下就是一个简单的状态机
语法分析
语法分析就是在词法分析的基础上,识别表达式的语法结构的过程
将刚刚识别出来的句子变成一个个的语法单元
抽象语法树
表达式的语法结构可以用树来表示,故而出现抽象语法树之称。其中每个节点(子树)是一个语法单元,这个单元的构成规则就叫语法。每个节点还可以有下级节点。简单的说就是把刚刚分析出来的词法单元变为一棵树
那么,怎么把刚刚的词法单元变为一棵树呢?
这里要说两个东西:上下文无关语法和递归下降算法
上下文无关语法
语言句子无需考虑上下文,就可以判断正确性。可以使用巴科斯范式BNF来表达
产生式:一个表达式可以由另外已知类型的表达式或者符号推导产生。
内置符号:字面量string 、bool、number、标识符、运算符
一个基础表达式可以由常量或标识符组成
一个乘法表达式可以由基础表达式或乘法表表达式 * 基础表达式组成
一个简单的BNF生成规则类似如下:
digit::=0|1|2|3|4|5|6|7|8|9
上述文法代表任意一个0到9的任意一个数字。这里的尖括号“<>”是非终结符,如果一个非终结符出现在生成规则的右边,这意味着会有另一条生成规则来解释代替它的位置。考虑如下生成规则:
fullname::=title name name
这里 fullname 由 title 、 name 和另一个name字符串构成。例如,我们可以定义如下生成规则来代替 title::=Mr|Mrs|Ms|Miss|Dr
在这条规则中,Mr、Mrs、Ms、Miss和Dr均是终结符,它们是title的实际值,符号“|”在这里代表元字符,含义是“或"。这条规则的具体含义title可被解释为Mr或Mrs或Ms或Miss或Dr中的一个。
递归下降算法
递归下降算法就是自顶向下构造语法树,不断地向Token进行语法展开,展开过程中可以会遇到递归的情况。
类型检查
根据子表达式的类型构造出表达式的类型。
例如,表达式A+B的类型是根据A和B的类型定义的。
编译时检查 & 运行时检查
类型检查可以发生在表达式的编译阶段,即在构造语法树的阶段;也可以发生在执行时的阶段
- 编译时:需要提前声明参数的类型,在构建语法树过程中进行类型检查
- 执行时:可以根据执行时的参数输入的值类型,在执行过程中进行类型检查
设计一个规则引擎
设计目标
设计一个规则引擎,支持特定的语法、运算符、数据类型和优先级。并且支持基于以上预定义语法的规则表达式的编译和执行
词法分析
有限状态机
语法分析
优先级的表达
type precedence struct{
validSymbols []Symbol //当前优先级支持的运算符类型
nextPrecedence *precedence //更高优先级的
planner planner //当前优先级的处理函数
}
语法树结构
一元运算符:左子树为空,右子树为右操作数
二元运算符:左子树为左操作数,右子树为右操作数
括号:左子树为空,右子树为内部表达式的AST
语法树的执行 预先定义好每种操作符的执行逻辑。对抽象语法树进行后序遍历执行,即:
- 先执行左子树,得到左节点的值
- 再执行右子树,得到右节点的值
- 最后根据根节点的操作符执行得到根节点的值
类型检查
检查时机:执行时检查
检查方法:在一个节点的左右子节点执行完成后,分别校验左右子节点的类型是否符合对应操作符的类型检查预设规则。
解释型语言和编译型语言
-
有的语言提前把代码一次性转换完毕,这种就是编译型语言,用的转换工具就叫编译器,比如C、C++、Go。一次编译可重复执行
- 编译后产物不能跨平台,不同系统对可执行文件的要求不同。.exe
- 特殊的,c、c++、汇编、源代码也不能跨平台
-
有的语言则可以一边执行一边转化,用到哪里了就转哪里,这种就是解释性语言,用的转化工具叫虚拟机或者解释器,比如java python、javascript