这是我参与「第五届青训营 」伴学笔记创作活动的第 5 天
规则引擎设计与实现
课程目标
- 理解规则引擎的组成部分及应用场景
- 理解规则引擎的核心原理-编译原理的相关概念
- 设计并实现一个规则引擎-YoungEngine
- 结合之前所学课程,实现一个Web版规则引擎(自行实现)
课程目录
01. 认识规则引擎
例子
抖音商城要搞活动啦~
活动期间用户购买相应的产品会获得商城积分
过了几天,运营同学说,这个效果不太好,我们再改下规则,变成100-200元的赠送20,200-500元赠送90,500-800赠送100......如此类推一直到1w。
然后产品又脑洞大开了,觉得这个条件不够精细化,还要根据商品的标签属性,用户标签来判断。如果是新用户就乘2,如果商品是XX活动的特卖商品,积分就多加20...
能不能有一种系统,把一些条件翻译成计算规则,把一些需要的属性比如价格或者标签之类的,全部放进去,系统会自动计算出来用户会获得的积分——————规则引擎
规则引擎的定义
规则引擎是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则,并根据业务规则做出业务决策。
使用规则引擎
解决开发人员重复编码的问题
业务决策与服务本身解耦,提高服务的可维护性
缩短开发路径,提高效率
组成部分
应用场景
1.风控对抗
与黑灰产的对抗过程中,策略研发和产品需要能够根据黑灰产特征进行快速识别和对抗。规则引擎作为风控系统的核心,是产研人员能够不断地调整合优化对抗策略,以实现最好的风控识别效果
2.活动策略运营
业务活动的运营需要及时根据用户效果反馈进行运营策略的优化和调整。引入规则引擎后,可以将服务代码与业务运营逻辑解耦,提高运营策略的迭代效率。方便新玩法的探索和效果验证
3.数据分析和清洗
在数据分析系统中使用规则引擎可以便捷的实现对数据进行整理、清洗和转换。数据分析师可以根据不同需求来自定义数据处理的规则,方便快捷的产出所需要的数据。
02.编译原理基本概念
词法分析 Lexical Analysis
词法分析就是把源代码字符串转换为词法单元(Token)的这个过程
如何识别Token?————有限自动机(Finite-State Automaton
有限自动机就是一个状态机,他的状态数量是有限的。该状态机在任何一个状态,基于输入的字符,都能做一个确定的状态转换。
开始处于start这个状态,在读到第一个单词 p 字母的时候,会转移到 s1 这个状态继续读 r i c e 一直到单词结束都在 s1 这个状态里,之后读到一个空格,他会转移出去,判定其是一个参数,整个过程就是把 price 这个Token切分出来了
语法分析 Syntax Analysis
语法分析就是在词法分析的基础上,识别表达式的语法结构的过程
抽象语法树
表达式的语法结构可以用树来表示,其每个节点(子树)是一个语法单元,这个单元的构成规则就叫“语法”。每个节点还可以有下级节点。
抽象语法树 Abstract Syntax Tree
上下文无关语法 Context-Free Grammer
- 语言句子无需考虑上下文,就可以判断正确性。可以使用巴科斯范式(BNF)来表达
产生式:一个表达式可以由另外已知类型的表达式或者推到产生
- 内置符号:字面量(string、bool、number) 标识符、运算符
- 一个基础表达式可以由 常量(string、bool、number)或标识符(identifier)
- 一个基础乘法表达式可以由 基础表达式 或者 乘法表达式 * 基础表达式 组成
递归下降算法 Recursive Descent Parsing
- 递归下降算法就是自顶向下构造语法树
- 不断地对Token进行语法展开(下降),展开过程中可能会遇到递归的情况
演示
类型检查
类型综合
- 根据子表达式的类型构造出父表达式的类型。例如,表达式A+B的类型是根据A和B的类型定义的
编译时检查 & 运行时检查
类型检查可以发生在表达式的编译阶段,即在构造语法树的阶段; 也可以发生在执行时的阶段
- 编译时:需要提前声明参数的类型,在构建语法树过程中进行类型检查
- 执行时:可以根据执行时的参数输入的值类型,再执行过程中进行类型检查
03.设计一个规则引擎
设计目标
设计一个规则引擎,支持特定的词法、运算符、数据类型和优先级。并且支持基于以上预定义语法的规则表达式的编译和执行
词法分析
词法(合法Token)
数据类型
运算符
优先级
语法分析
语法树执行与类型检查
语法树执行
预先定义好每种操作符的执行逻辑
对抽象语法树进行后续遍历
执行,即:
- 先执行左子树,得到左节点的值;
- 再执行右子树,得到右节点的值;
- 最后根据节点的操作符执行得到根节点的值。
类型检查
检查时机:执行时检查
检查方法:在一个节点的左右子节点执行完成后,分别校验左右子节点的类型是否符合对应操作符的类型检查预设规则
- ‘>’符号要求左右子节点的值都存在且为 int或float
- ‘!’符号要求左节点为空且右节点的值为 bool