规则引擎设计与实现 | 青训营笔记

44 阅读4分钟
  • 这是我参与「第五届青训营 」笔记创作活动的第7天

    只不过是字节给我的任务罢了

    规则引擎的定义

    规则引擎是一种嵌入在应用服务中的组件,可以将灵活多变的业务决策从服务代码中分离出来。通过使用预定义的语义模块来编写业务逻辑规则。在执行时接受数据输入、解释业务规则,并做出决策。规则引擎能大大提高系统的灵活性和扩展性。

    规则引擎可以解决开发人员重复编码的问题,业务决策与服务本身解耦,提高服务的可维护性,缩短开发路径,提高效率

    应用场景

    • 风控对抗
    • 活动策略运营
    • 数据分析和清洗

    编译原理基本概念

    词法分析:把源代码字符串转换为词法单元(Token)的这个过程。

    语法分析:在词法分析的基础上识别出表达式的语法结构

    抽象语法树:表达式抽象语法结构的树状表示,对一个表达式,其抽象语法树是唯一确定的

    类型检查:验证执行的结果是否为合适的数据类型,抽象语法树中,通常会验证某节点的子节点的数据类型是否合法

    参数注入:在规则执行过程中,使用输入的参数值来计算语法树中的标识符节点值的过程

    词法分析

    • HelliWrold1通过了青训营选拔--> HelliWrold1 通过了 青训营选拔

    • 如何实现识别Token?——有限自动机

      • 有限自动机就是一个状态机,状态数量是有限的,该状态机在任何一个状态,基于输入的字符,都能做一个确定的状态转换
      • 将输入的字符分为参数、数字、符号

    语法分析

    • 在词法分析的基础上分出左操作数、右操作数、操作符

    • 抽象语法树

      • 表达式的语法结构可以用树来表示,每个节点都是一个语法单元,单元的构成规则叫语法,每个节点下面还有下级节点
    • 上下文无关语法 Context-Free Grammer:语言句子无需考虑上下文就可以判断正确性,可以使用巴科斯范式(BNF)表达

      • 产生式:一个表达式可以由另外已知类型的表达式或符号推导产生

        • 内置符号:字面量(string、bool、number)、运算符
        • 基础表达式由常量(string、bool、number)或标识符
        • 一个乘法表达式可以由基础表达式或乘法表达式*基础表达式组成
        • 产生式是递归产生的
    • 递归下降算法Recursive Descent Parsing

      • 递归下降算法是自顶向下构造语法树
      • 不断地对Token进行语法展开(下降),展开的过程中可能会遇到递归的情况
      • 递归时,尽可能快地找到匹配的表达式类型,根据期望的类型决定究竟应该上升还是下降
    • 类型检查

      • 类型综合

        • 根据子表达式类型构造出父表达式的类型,例如,表达式A+B的类型是由A和B的类型定义的
      • 编译时检查&运行时检查

        • 类型检查可以发生在表达式的编译阶段,即在构造语法树的阶段,也可以发生在执行的阶段
        • 编译时:需要提前声明参数的类型,在构造语法树的阶段进行检查
        • 执行时:可以根据执行时的参数输入的值类型,在执行过程中进行检查

    设计一个规则引擎

    设计目标

    设计一个规则引擎,支持特定的语法、运算符、数据类型和优先级。并且支持基于以上预定义语法的规则表达式的编译和执行

    • 词法(合法Token)

    • 运算符

    • 数据类型

    • 优先级

      • 优先级的表达:用结构体中的一个成员*precedence指向更高优先级的类型
    • 语法树结构

      • 一元运算符:左子树为空,有子树为右操作数
      • 二元运算符:左子树为左操作数,右子树为右操作数
      • 括号:左子树为空,右子树为内部表达式的AST
    • 语法树执行

      • 预定义每种操作符的执行逻辑
      • 对抽象语法树进行后根遍历
    • 类型检查

      • 执行时进行检查
      • 检查方法:在一个节点的左右子树执行完成后,分别校验左右子节点的类型是否符合对应操作符的类型检查预设规则

实现规则引擎

github.com/qimengxingy…

参考

juejin.cn/post/719336…