后端与 规则引擎 | 青训营笔记

112 阅读4分钟

这是我参与「第五届青训营 」伴学笔记创作活动的第 6 天,本次课程学习了规则引擎,对规则引擎的设计和实现有了初步的了解,下面是我的收获

规则引擎的设计与实现

1.1 规则引擎简介

1.1.1 规则引擎的定义

规则引擎是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策,接收数据输入解释业务规则,并根据业务规则做出决策

优点

解决开发人员重复编码的问题,业务决策与服务为本身解耦,提高了服务的可维护性,缩短开发路径,提高开发效率

1.1.2 组成部分

  • 数据输入

支持接收使用预定义的语义编写的规则作为策略集,例如"age > 18" 此外,接收业务的数据作为执行过程中的参数,比如标签、价格

  • 规则理解

能够按照预定义的词法、语法、优先级、运算符等正确理解业务规则所表达的语义

  • 规则执行

根据执行时输入的参数对策略集中的规则进行正确的解释和执行,同时对规则执行过程中的数据类型进行检查,确保执行结果正确

1.1.3 应用场景

  • 分控对抗
  • 活动策略运营
  • 数据分析和清洗

1.2 编译原理

1.2.1 简介

实现规则引擎需要编译原理的知识,分为以下三步

  • 理解

词法分析:把源代码字符串转换为词法单元(Token)的这个过程

语法分析:在词法分析的基础上识别出表达式的语法结构

  • 执行

抽象语法树:表达式抽象语法结构树状表示,此外对于一个表达式,其抽象语法树一定是唯一确定的

  • 输入、输出

参数注入:在规则执行过程中,使用输入的参数值来计算语法树中的标识符节点值的过程

类型检查:验证执行的结果是否为合适的数据类型,在抽象语法树中,通常会验证某节点的子节点的数据是否合法

1.2.2 词法分析

词法分析就是把源代码字符串转换为词法单元(Token)的这个过程

例如

rainyday通过了青训营选拔 -> rainyday 通过了 青训营选拔

price > 500 && (isNewUser || userLevel > 5):

price > 500 && ( isNewUser || userLevel > 5 )

如何识别Token

有限自动机就是一个状态机,它的状态数量是有限的,该状态机在任何一个状态,基于输入的字符,都能做一个确定的状态转换,该转化是幂等的

1.2.3 语法分析

语法分析就是在词法分析的基础上,识别表达式的语法结构的过程

2023-02-01-16-52-47-image.png

抽象语法树

表达式的语法结构可以用树表示,其每个节点是一个语法单元,这个单元构成规则就叫"语法",每个节点还可以有下级节点

  • 上下文无关语法

r := a > b

即语言句子无需考虑上下文,就可以判断正确性,可以用巴科斯范式(BNF)表达

exp : add ;
add : add '+' mul | mul //加法表达式 a + b + c a + b * c
mul : mul '*' pri | pri //乘法表达式 a * b *c
pri : string | bool | number | identifer age | 20 | "qwer" 

产生式:一个表达式可以由另外已知类型的表达式或者符号推导产生

  • 内置符号:字面量(string、bool、number)标识符、运算符
  • 一个基础表达可以由常量(string、bool、number)或标识符(identifier)
  • 一个乘法表达式可以由基础表达式或者乘法表达式 * 基础表达式组成

递归下降算法

递归下降算法就是自顶向下构造语法树

不断的对Token进行语法展开(下降),展开过程可能会遇到递归和回溯

1.2.4 类型检查

  • 类型综合

根据子表达式的类型构造出父表达式的类型,例如表达式A+B的类型是根据A和B的类型定义的

2023-02-01-17-21-35-image.png

以上分别是正确和错误示例

  • 编译时检查 & 运行时间检查

类型检查可以发生在表达式的编译阶段,也就是构造语法树的阶段

编译时:需要提前声明参数的类型,在构建语法树过程中进行类型检查

int1 : int; str1 : string

执行时:根据执行时的参数输入的值类型,在执行过程中进行类型检查

int1 : 108; str1 : "300"