规则引擎设计与实现 | 青训营笔记

60 阅读4分钟

这是我参与「第五届青训营」伴学笔记创作活动的第6天

规则引擎和编译原理

认识规则引擎

  • 规则引擎的定义

    规则引擎是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则,并根据业务规则做出业务决策

    好处:

    解决开发人员重复编码的问题

    业务决策与服务本身解耦,提高服务的可维护性

    缩短开发路径,提高效率

  • 组成部分

    1. 数据输入

      支持接受使用预定义的语义编写的规则作为策略集。比如 price > 500

      接受业务的数据作为执行过程中的的参数,比如价格、标签等

    2. 规则理解

      能够按照预先定义的词法、语法、优先级、运算符等正确理解业务规则所表达的语义

    3. 规则执行

      根据执行时输入的参数对策略集中的规则进行正确的解释和执行。同时对规则执行过程中的数据类型进行检查,确保执行结果正确

  • 应用场景

    1. 风险对抗
    2. 活动策略运营
    3. 数据分析和清洗

编译原理基本概念

  • 规则引擎编译原理

    1. 理解

      词法分析

      语法分析

    1. 执行

    2. 输入输出

      遍历过程中会根据我们提前设置好的一些语法来去做一些计算,在这过程中我们需要与外界进行交互,也就是输入和输出

      • 参数注入

        在规则执行过程中,使用输入的参数值来计算语法树中的标识符节点值的过程

      • 类型检查

        验证执行的结果是否为合适的数据类型。在抽象语法树中,通常会验证某节点的子节点的数据类型是否合法

  • 词法分析 Lexical Analysis

    把源代码字符串转换为词法单元(Token)的这个过程

    如何识别Token?有限自动机(Finite-State Automaton)

    有限自动机就是一个状态机,他的状态数量是有限的,该状态机在任何一个状态,基于输入的字符,都能做一个确定的状态转换

  • 语法分析 Syntax Analysis

    在词法分析的基础上识别表达式的语法结构

    词法分析、语法分析可以将一个表达式转化为规则引擎可以理解的东西:抽象语法树

  • 抽象语法树 Abstract Syntax Tree

    表达式的语法结构可以用树来表示,其每个节点(子树)是一个语法单元,这个单元的构成规则就叫 语法 。每个节点还可以有下级节点

    抽象语法树可以唯一标识一个表达式

    抽象语法树是表达式抽象语法结构的树状表示,对于一个表达式,抽象语法树一定是唯一确定的

    执行阶段会对抽象语法树做一个执行,执行简单来说就是对树进行一个遍历

    • 上下文无关语法 Context-Free Grammar

      语言句子无需考虑上下文,就可以判断正确性。可以使用巴科斯范式(BNF)来表达

      exp : add;

      add : add '+' mul | mul; // 加法表达式 a + b + c a + b * c

      mul : mul '*' pri | pri; // 乘法表达式 a * b * c

      pri : string | bool | number | identifer; // 基础表达式 weight | 20 | "abcde"

      产生式:一个表达式可以由另外已知类型的表达式或者符号推导产生

      • 内置符号:字面量(string、bool、number)、标识符、运算符

      • 一个基础表达式可以由 常量(string, bool, number)或 标识符(identifer)

      • 一个乘法表达式可以由 基础表达式 或 乘法表达式 * 基础表达式 组成

        ... ...

    • 递归下降算法 Recursive Descent Parsing

      递归下降算法就是自顶向下构建语法树

      不断的对Token进行语法展开(下降),展开过程中可能会遇到递归的情况

  • 类型检查

    • 类型综合

      根据子表示的类型构造出父表达式的类型。例如,表达式 A+B 的类型是根据 A 和 B 的类型定义的

    • 编译时检查 & 运行时检查

      类型检查可以发生在表达式的编译阶段,即在构造语法树的阶段;也可以发生在执行时的阶段

      • 编译时:需要提前声明参数的类型,在构建语法树过程中进行类型检查

        int1 : int; str1 : string

      • 执行时:可以根据执行时的参数输入的值类型,在执行过程中进行类型检查

        int1: 108; str1: "300"