【青训营笔记】- 规则引擎设计与实现

77 阅读6分钟

这是我参与「第五届青训营 」笔记创作活动的第6天。

前言

规则引擎是一种嵌入在应用服务中的组件,可以将灵活多变的业务决策从服务代码中分离出来。通过使用预定义的语义模块来编写业务逻辑规则。在执行时接受数据输入、解释业务规则,并做出决策。规则引擎能大大提高系统的灵活性和扩展性。

课程目标

  1. 理解规则引擎的组成部分及应用场景
  2. 理解规则引擎的核心原理 - 编译原理的相关概念
  3. 设计并实现一个规则引擎 - YoungEngine
  4. 结合之前所学课程,实现一个Web版规则引擎 (自行实现)

一、认识规则引擎

探究规则引擎的由来、优点以及应用场景。简单了解规则引擎的组成和实现原理

实际场景

  • 抖音商城购买金额获得商城积分:ifelse - 循环判断金额与积分的关系 - 规则引擎快速规定
  • 风控对抗:与黑灰产的对抗过程中,策略研发和产品需要能够根据黑灰产特征进行快速识别和对抗。规则引擎作为风控系统的核心,使产研人员能够不断的调整和优化对抗策略,以实现最好的风控识别效果。
  • 活动策略运营:业务活动的运营需要及时根据用户效果反馈进行运营策略的优化和调整引入规则引擎后,可以将服务代码与业务运营逻辑解耦,提高运营策略的迭代效率。方便新玩法的探索和效果验证
  • 数据分析和清洗:在数据分析系统中使用规则引擎可以便捷的实现对数据进行整理、清洗和转换。数据分析师可以根据不同的需求来自定义数据处理的规则,方便快捷的产出所需要的数据。

规则引擎:

  • 输入: 计算规则、商品价格、用户标签、商品属性
  • 输出:积分
  • 规则简单容易配置、可扩展

定义:规则引擎是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则,并根据业务规则做出业务决策。

规则引擎前

图2:规则引擎前

规则引擎后

图2:规则引擎后

+ 优点: + 解决开发人员重复编码的问题 + 业务决策与服务本身解耦,提高服务的可维护性 + 缩短开发路径,提高效率 + 组成部分 + 数据输入:支持接受使用预定义的语义编写的规则作为策略集。比如price > 500”接受业务的数据作为执行过程中的参数,比如价格、标签等 + 规则理解:能够按照预先定义的词法语法、优先级、运算符等正确理解业务规则所表达的语义 + 规则执行:根据执行时输入的参数对策略集中的规则进行正确的解释和执行。同时对规则执行过程中的数据类型进行检查,确保执行结果正确

二、编译原理基本概念

程序员的三大浪漫之一: 编译原理。介绍编译、词法分析语法分析、抽象语法树等概念。

规则引擎:理解 - 执行 - 输入输出

  • 理解:词法分析和语法分析。
  • 执行:语义分析和抽象语法树
  • 输入与输出:参数注入、类型检查

词法分析

  • 词法分析就是把源代码字符串转换为词法单元(Token)的这个过程
  • 例如: 阿耿通过了青训营选拔 -> 阿耿|通过了|青训营选拔 -> 主语|谓语|宾语
  • 识别词法单元使用有限自动机:有限自动机就是一个状态机,它的状态数量是有限的。该状态机在任何一个状态,基于输入的字符,都能做一个确定的状态转换。

image.png

左:抽象语法树 中:有限自动机 右:类型综合

语法分析

  • 语法分析就是在词法分析的基础上,识别表达式的语法结构的过程
  • 语法分析使用抽象语法树:表达式的语法结构可以用树来表示,其每个节点(子)是一个语法单元,这个单元的构成规则就叫“语法”。每个节点还可以有下级节点。

抽象语法树

  • 上下文无关语法 Context-Free Grammar:语言句子无需考虑上下文,就可以判断正确性。可以使用巴科斯范式(BNF)来表达
  • 递归下降算法 Recursive Descent Parsing:递归下降算法就是自顶向下构造语法树不断的对Token进行语法展开(下降),展开过程中可能会遇到递归的情况。

类型检查

  • 类型综合:根据子表达式的类型构造出父表达式的类型。例如,表达式A+B的类型是根据A和B的类型定义的
  • 编译时检查 & 运行时检查:类型检查可以发生在表达式的编译阶段,即在构造语法树的阶段;也可以发生在执行时的阶段
  • 编译时: 需要提前声明参数的类型,在构建语法树过程中进行类型检查 int1 : int; str1 : string
  • 执行时: 可以根据执行时的参数输入的值类型,在执行过程中进行类型检查 int1: 108; str1:"300"

三、设计一个规则引擎

从零开始设计一个规则引擎YoungEngine,明确其对词法语法的支持,设计编译和执行的流程。

  • 设计目标:设计一个规则引擎,支持特定的词法、运算符、数据类型和优先级。并且支持基于以上预定义语法的规则表达式的编译和执行。

词法分析

  • 词法(合法Token):
    • 参数: 由字母数字下划线组成 eg: _ab2、user_name
    • 布尔值: true 、false
    • 字符串:“abcd”、“abcd’、*abcd
    • 十进制int: 1234
    • 十进制float: 123.5
    • 预定义运算符: + -
  • 运算符
    • 一元运算符: + -
    • 二元运算符: +- * / % > < >= <= == !=
    • 逻辑操作符:&& || !
    • 括号: ( )
  • 运算符优先级:
优先级运算符
0||
1&&
2!-+
3> >= < <= == !=
4单目运算符-+
5* //
6!-+
  • 有限自动状态机

image.png

语法分析

  • 定义产生式:image.png
  • 优先级的表达:
type precedence struct {
   vakudSymbols   []Symbol    //当前优先级支持的运算符类型
   nextPrecedence *precedence //更高优先级的
   planner        planner     //当前优先级的处理函数
}
  • 语法树结构
    • 一元运算符: 左子树为空,右子树为右操作数
    • 二元运算符: 左子树为左操作数,右子树为右操作数
    • 括号: 左子树为空,右子树为内部表达式的AST
    • image.png

语法树执行与类型检查

  • 语法树执行:预先定义好每种操作符的执行逻辑对抽象语法树进行后续遍历执行,即
    • 先执行左子树,得到左节点的值;
    • 再执行右子树,得到有节点的值:
    • 最后根据根节点的操作符执行得到根节点的值
  • 类型检查:
    • 检查时机: 执行时检查
    • 检查方法: 在一个节点的左右子节点执行完成后,分别校验左右子节点的类型是否符合对应操作符的类型检查预设规则。
    • '>'符号要求左右子节点的值都存在且为 int或float.
    • '!'符号要求左节点为空且右节点的值为 bool

四、规则引擎的实现

实战演练部分,实现规则引擎YoungEngine的各个部分并介绍其中的几个重点实现思路。 项目地址: qimengxingyuan/young_engine: 简单的规则引擎 (github.com)

五、总结

本次课程主要学习规则引擎的定义、应用场景,实现方式。结合编译原理的知识从头到尾介绍了如何去实现一个规则引擎,讲解了词法分析,语法分析,抽象语法树等知识点。最后结合一个案例对一个具体的规则引擎进行实现,初步了解了规则引擎。