认识规则引擎 | 青训营笔记

60 阅读2分钟

认识规则引擎

定义

规则引擎是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则。并根据业务规则作出业务决策。

组成部分

  • 数据输入,支持接受使用预定义的语义编写的规则作为策略集。比如“price > 500”
  • 规则理解,能够按照预先定义的词法,语法,优先级,运算符等正确理解业务规则所表达的语义
  • 规则执行,根据执行时输入的参数对策略集中的规则进行正确的解释和执行。同时对规则执行过程中的数据类型进行检查,确保结果正确

应用场景

  • 风控对抗
  • 活动策略运营
  • 数据分析和清洗

编译原理基本概念

image-20230131180841077

词法分析

将源代码字符串转换为词法单元(Token)的这个过程

如何识别Token

有限自动机

有限自动机是一个状态机,他的状态数量有限。该状态机在任何一个状态,基于输入都有一个确定的转换。

语法分析

在词法分析的基础上,识别表达式的语法结构

抽象语法树

price > 500 && (isNew || (level > 5))

image-20230131181807146

表达式的语法结构可以用树来表示,其每个节点(子树,也是第一步的token)是一个语法单元,这个单元的构成规则就叫“语法”。每个节点还可以有下级节点。

上下文无关语法

句子不需要考虑上下文就可以判断正确性。可以使用巴克斯范式(BNF)来表达。

递归下降算法

自顶向下构造语法树

不断的对token进行语法展开(下降),展开过程中可能遇到递归情况

类型检查

  • 类型综合,根据子表达式的类型构造父表达式的类型。例如A+B的类型是根据A和B的类型来定义的

  • 编译时检查和运行时检查。

    • 编译阶段检查就是在构造语法树阶段
    • 运行时检查是拿到真正数据的时候进行检查

设计目标

设计一个规则引擎,支持特定的词法、运算符、数据类型和优先级。并且支持基于以上预定义语法的规则表达式的编译和执行

词法分析

设计状态机

image-20230131234322266