规则引擎设计与实现|青训营笔记

78 阅读6分钟

这是我参与「第五届青训营 」笔记创作活动的第7天

本篇文章将主要从规则引擎和编译原理基本概念两个方面进行介绍和总结。

1. 规则引擎

定义:规则引擎是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则,并根据业务规则刚做出业务决策。

需要注意的是:解决开发人员重复编码的问题,业务决策与服务本身解耦,提高服务的可维护性,缩短开发路径,提高效率。

1.1 规则引擎的组成部分

数据输入:支持接受使用预定义的语义编写的规则作为策略集。比如“price > 500”,接受业务的数据作为执行过程中的参数,比如价格、标签等。

规则理解:能够按照预先定义的词法、语法、优先级、运算符等正确理解业务规则所表达的语义。

规则执行:根据执行时输入的参数对策略集中的规则进行正确的解释和执行。同时对规则执行过程中的数据类型进行检查,确保执行结果正确。

1.2 规则引擎的应用场景

风控对抗:与黑灰产的对抗过程中,策略研发和产品需要能够根据黑灰产特征进行快速识别和对抗。规则引擎作为风控系统的核心,使产研人员能够不断地调整和优化对抗策略,以实现最好地风控识别效果。

活动策略运营:业务活动的运营需要及时根据用户效果反馈进行运营策略的优化和调整。引入规则引擎后,可以将服务代码与业务运营逻辑解耦,提高运营策略的迭代效率。方便新玩法的探索和效果验证。

数据分析和清洗:在数据分析系统中使用规则引擎可以便捷的实现对数据进行整理、清洗和转换。数据分析师可以根据不同的需求来定义数据处理的规则,方便快捷的产出所需要的数据。

2 编译原理基本概念

对于规则引擎编译原理的主要部分分为三个阶段:理解、执行、输入输出

理解:词法分析:把源代码字符串转换为词法单元(Token)的这个过程

语法分析:在词法分析的基础上识别出表达式的语法结构

执行:抽象语法树:表达式抽象语法结构的树状表示,对于一个表达式,抽象语法树一定时唯一确定的

输入输出:参数注入:在规则执行过程中,使用输入的参数值来计算语法树中的标识符节点值的过程

类型检查:验证执行的结果是否为合适的数据类型。在抽象语法树中,通常会验证某节点的子节点的数据类型是否合法

2.1 词法分析

词法分析是把源代码字符串转换为词法单元(Token)的这个过程

识别Token,主要通过有限自动机,有限自动机就是一个状态机,它的状态数量是有限的。该状态机在任何一个状态,基于输入的字符,都能做一个确定的状态转换。

2.2 语法分析

语法分析就是在词法分析的基础上,识别表达式的语法结构的过程

抽象语法树:表达式的语法结构可以用树来表示,其每个节点(子树)是一个语法单元,这个单元的构成规则就叫“语法”。每个节点还可以有下级节点。

注意:抽象语法树和我们之前所学的二叉树类似,需要一步一步进行分支。

2.2.1 上下文无关语法

语言句子无需考虑上下文,就可以判断正确性。可以使用巴科斯范式(BNF)来表达

产生式:一个表达式可以由另外已知类型的表达式或者符合推导产生

内置符号:字面量(string、bool、number)标识符、运算符

一个基础表达式可以由常量(string、bool、number)或标识符(identifier)

一个乘法表达式可以由基础表达式或者乘法表达式* 基础表达式组成

2.2.2 递归下降算法

递归下降算法就是自顶向下构造语法树

不断的对Token进行语法展开(下降),展开过程中可能会遇到递归的情况。

2.3 类型检查

2.3.1 类型综合

根据子表达式的类型构造出父表达式的类型。例如:表达式A+B的类型是根据A和B的类型定义的

2.3.2 编译时检查&运行时检查

类型检查可以发生在表达式的编译阶段,即在构造语法树的阶段;也可以发生在执行时的阶段

  • 编译时:需要提前声明参数的类型,在构建语法树过程中进行类型检查
int1 : int; str1 : string
  • 执行时:可以根据执行时的参数输入的值类型,在执行过程中进行类型检查
int1 : 108; str : "300"

3.设计一个规则引擎

这部分主要从设计目标、词法与语法、优先级与语法树三个方面进行介绍。根据上面的规则引擎的语法基础知识,进行应用。课堂上,主要为我们介绍了一个项目,用实际的代码进行讲解,这边不再进行叙述。

3.1 语法分析

expr: logOr EOF;
logOr: logOr '||' logAnd | logAnd;
logAnd: logAnd '&&' logNot | logNot;
logNot: '!' logNot | cmp;
cmp: cmp '>' add | cmp '>=' add | cmp '<'add | cmp '<=' add | cmp '==' add | cmp '!=' add | add;
add: add '+' mul | add '-' mul | mul;
mul: mul '*' pri | mul '/' pri | mul '%' pri | pri;
pri: BooleanLiteral|IntegerLiteral|FloatLiteral|StringLiteral|Identifier|'('expr')';

优先级的表达

type precedence struct {
  validSymbols    []Symbol        //当前优先级支持的运算符类型
  nextPrecedence  *precedence     //更高优先级的
  planner         planner         //当前优先级的处理函数
}

4.总结

通过学习规则引擎的知识,了解到了规则引擎的应用场景和相关语法知识,对规则引擎有了一定的了解,但仍存在很多不足,需要继续努力。

5.引用

本篇文章内容主要来自于字节录播课程。