课程笔记 - 规则引擎设计与实现 | 青训营笔记

195 阅读3分钟

这是我参与「第五届青训营 」伴学笔记创作活动的第 7 天


规则引擎

定义

规则引擎是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则,并根据业务规则做出业务决策。

作用

  • 解决开发人员重复编码的问题
  • 业务决策与服务本身解耦,提高服务的可维护性
  • 缩短开发路径,提高效率

架构设计

  • 数据输入
  • 规则理解
  • 规则执行

应用场景

  • 风控对抗
  • 活动策略运营
  • 数据分析清洗

编译原理

词法分析、语法分析 -> 抽象语法树 -> 参数注入,类型检查

词法分析

把源代码字符串转换为词法单元(Token)的这个过程

  • 有限自动机
    状态数量有限的状态机。该状态机在任何一个状态,基于输入的字符串,都能做一个确定的状态转换

语法分析

在词法分析的基础。上,识别表达式的语法结构的过程

image.png

抽象语法树

定义:每个节点(子树)是一个语法单元,这个单元的构成规则叫“语法”,每个节点可以有子节点

image.png

  • 上下文无关语法

    语言句子无需考虑上下文,就可以判断正确性。可以使用巴克斯范式(BNF)来表达

    add : add '+' mul | mul;                  // 加法表达式
    mul : mul '*' pri | pri;                  // 乘法表达式
    pri : string | bool | number | identifer; // 基础表达式
    

    产生式:一个表达式可以由另外已知类型的表达式或者符号推导产生

    • 内置符号:字面量(string、bool、number)标识符、运算符
    • 一个基础表达式可以由常量(string、bool、 number)或标识符(identifier)
    • 一个乘法表达式可以由基础表达式或者乘法表达式*基础表达式组成
  • 递归下降算法
    自顶向下构造语法树,不断对Token进行语法展开(下降)

类型检查

  • 类型总和
    根据子表达式的类型构造出父表达式的类型。例如表达式A+B的类型是根据A和B的类型定义的。

  • 编译时检查 & 运行时检查
    编译阶段:构造语法树的阶段。需要提前声明参数类型
    运行阶段:根据执行时的参数输入类型在执行阶段进行检查

设计规则引擎

目标:设计一个规则引擎,支持特定的词法、运算符、数据类型和优先级。并且支持基于以上预定义语法的规则表达式的编译和执行。

整体

  • 词法(合法Token)
    • 参数名称
    • 布尔值
    • 字符串
    • 十进制int
    • 十进制float
    • 预定义运算符
  • 运算符
    • 一元运算符
    • 二元运算符
    • 逻辑操作符
    • 括号
  • 数据类型
    • 字符串
    • 布尔值
    • 十进制int
    • 十进制float
  • 优先级
    image.png

词法分析

  • 状态机

image.png

  • 语法树结构
    • 一元运算符:左子树为空,右子树为右操作数
    • 二元运算符:左子树为左操作数,右子树为右操作数
    • 括号:左子树为空,右子树为内部表达式的AST

image.png

  • 语法树执行与类型检查
    • 语法树执行
      预先定义好每种操作符的执行逻辑,对抽象语法树进行后序遍历(左右根)
    • 类型检查
      检查时机:执行时
      检查方法:在节点左右子树分别执行完成后,分别校验左右子节点类型是否符合预设规则