这是我参与「第五届青训营 」笔记创作活动的第4天
规则引擎设计与实现
认识规则引擎
规则引擎的定义
规则引擎是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则,并根据业务规则做出业务决策
组成部分
- 数据输入:支持使用预定义的语义编写的规则作为策励集。比如“price > 500”。接受业务的数据作为执行过程中的参数,比如价格、标签等
- 规则理解:能够按照预先定义的词法、语法、优先级、运算符等正确理解业务规则所表达的语义
- 规则执行:根据执行时输入的参数对策略集当中的规则进行正确的解释和执行。同时对规则中的数据类型进行检查,确保执行结果正确
应用场景
-
风控对抗
与黑灰产的对抗过程中,策略研发和产品需要能够根据黑灰产特征进行快速识别和对抗。规则引擎作为风控系统的核心,使产研人员能够不断的调整和优化对抗策略,以实现更好的风控识别效果。
-
活动策略运营
业务活动的运营需要及时根据用户效果反馈进行运营策略的优化和调整。引入规则引擎后,可以将服务代码和业务运营逻辑解耦,提高运营策略的迭代效率。方便新玩法的探索和效果验证
-
数据分析和清洗
在数据分析系统中使用规则引擎可以便捷的实现对数据进行整理、清洗和转换。数据分析师可以根据不同的需求来自定义数据处理的规则,方便快捷的产出所需要的数据。
编译原理基本概念
规则引擎的设计与实现与编译原理的各个过程有着相似的思想
编译原理的概念
-
词法分析:
将源代码字符串转换为词法单元(Token)的过程
-
语法分析:
在词法分析的基础上识别出表达式的语法结构
-
抽象语法树:
表达式抽象语法结构的树状表示,对于一个表达式,抽象语法树一定是唯一的
-
类型检查:
验证执行的结果是否为合适的数据类型。在抽象语法树中,通常会验证某节点的子节点的数据类型是否合法
-
参数注入:
在规则执行过程中,使用输入的参数值来计算语法树中的标识符节点值的过程
词法分析
词法分析就是将源代码字符串转换为词法单元(Token)的过程
那么如何识别Token呢?——有限自动机
有限自动机就是一个状态机,它的状态数量是有限的。该状态机在任何一个状态,基于输入的字符,都能做一个确定的状态转换。
语法分析
语法分析就是在词法分析的基础上,识别表达式的语法结构的过程
抽象语法树
表达式的语法结构可以用树来表示,其每个节点(子树)是一个语法单元,这个单元的构成规则就叫“语法”。每个节点还可以有下个节点。
抽象语法树
-
上下文无关语法
语言句子无需考虑上下文,就可以判断正确性。可以使用巴科斯范式(BNF)来表达
产生式:一个表达式可以由另外已知类型的表达式或者符号推导产生
-
递归下降算法
递归下降算法就是自顶向下构造语法树
不断的对Token进行语法展开(下降),展开过程中可能会遇到递归的情况。
类型检查
-
类型综合:根据子表达式的类型构造出父表达式的类型。例如,表达式A+B的类型是根据A和B的类型定义的
-
编译时检查 & 运行时检查
类型检查可能发生在表达式的编译阶段,即在构造语法树的阶段;也可能发生在执行时的阶段
- 编译时:需要提前声明参数的类型,在构建语法树中进行类型检查
- 执行时:可以根据执行时的参数输入的值类型,在执行过程中进行类型检查
类型检查就是检查一条表达式中的参数类型是否符合语法的定义,在抽象语法树中就是检查节点的左右子节点所表达的类型是否符合规范