规则引擎 |青训营笔记

142 阅读8分钟

这是我参与「第五届青训营 」笔记创作活动的第8天

一、本堂课重点内容:

    1. 理解规则引擎的组成部分及应用场景
    1. 理解规则引擎的核心原理 -编译原理的相关概念
    1. 设计并实现一个规则引擎 - YoungEngine
    1. 结合之前所学课程,实现一个Web版规则引擎(自行实现)

YoungEngine地址:github.com/qimengxingy…

对于没有开发经验的初学者,从没接触过规则引擎,这里仅对其概念和使用层面做理解,其设计原理暂且不做过多深入。

01认识规则引擎

规则引擎引入

现实生活中,规则无处不在。对于企业级应用来说,在IT技术领域,很多地方也应用了规则,比如路由表,防火墙策略,乃至角色权限控制(RBAC),或者Web框架中的URL匹配。不管是那种规则,都规定了一组确定的条件和此条件所产生的结果。举个例子:

条件结果
汽车是红色,车是运动型的,驾驶员是男性,驾驶员在16-25岁之间保险费用增加20%

对于确定的条件,根据输入的参保人的信息我们可以唯一确定其保险的费用(输出),当规则比较简单时,可以使用if else实现。

存在的问题:

  • 实际应用场景中,对于复杂的规则,我们的系统会充斥大量if else
  • 无法直观表达现有业务逻辑,新人入手困难
  • 新增&改动逻辑困难,极难扩展。
  • 每次变更逻辑时都需要经历一次完整的研发-测试-发布-回测-灰度 等漫长的研发活动,效率成本堪忧

所以隔离这部分无法避免的业务决策逻辑,让逻辑变得纯粹可独立维护,所有逻辑一目了然动态可配,就是规则引擎要做的事儿。

比如在商城营销活动中,在不同时段、不同用户、购买不同商品时获得不同积分的规则下:

中间的齿轮为规则引擎:

  • 输入: 计算规则、商品价格、用户标签、商品属性
  • 输出: 积分

规则引擎定义

定义

规则引擎是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则,并根据业务规则做出业务决策。(通俗来讲就是,规则引擎按照定义好的编译规则,正确理解业务规则所表达的语义,然后根据数据输入得到对应的数据输出)

优点

从开发角度:

系统中引入规则引擎后,业务规则不再以程序代码的形式驻留在系统中,取而代之的是处理规则的规则引擎,业务规则存储在规则库中,完全独立于程序。业务人员可以像管理数据一样对业务规则进行管理,比如查询、添加、更新、统计、提交业务规则等。业务规则被加载到规则引擎中供应用系统调用。

业务系统运行过程中难免会发生业务规则变化的情形,有了规则引擎,业务规则部分采用的是规则引擎实现,这样在系统正常运行的情况就可以利用规则引擎对业务规则进行修改,而不必对系统重新部署。

从业务角度:

业务人员独立配置业务规则,开发人员无需理解,让业务人员的规则和真正的实际情况一致。将逻辑代码业务代码进行解耦,降低其沟通成本,减少冲突矛盾,加快上线进度。 从原来的单线推进:

image.png

优化到并行:

组成部分

  • 数据输入:支持接受使用预定义的语义编写的规则作为策略集。比如price > 500接受业务的数据作为执行过程中的参数,比如价格、标签等。

  • 规则理解:能够按照预先定义的词法语法、优先级、运算符等正确理解业务规则所表达的语。

  • 规则执行:根据执行时输入的参数对策略集中的规则进行正确的解释和执行。同时对规则执行过程中的数据类型进行检查,确保执行结果正

应用场景

  • 风控对抗:与黑灰产的对抗过程中,策略研发和产品需要能够根据黑灰产特征进行快速识别和对抗。规则引擎作为风控系统的核心,使产研人员能够不断的调整和优化对抗策略,以实现最好的风控识别效果

  • 活动策略运营:业务活动的运营需要及时根据用户效果反馈进行运营策略的优化和调整引入规则引擎后,可以将服务代码与业务运营逻辑解耦,提高运营策略的迭代效率。方便新玩法的探索和效果验证

  • 数据分析和清洗:在数据分析系统中使用规则引擎可以便捷的实现对数据进行整理、清洗和转换。数据分析师可以根据不同的需求来自定义数据处理的规则,方便快捷的产出所需要的数据。

规则引擎的使用

以Java为例,得到规则引擎实例后,可以调用规则引擎中的方法,主要是put、excute和get这三个方法。 put用于传入需要传入的值,excute用于运行指定的规则包,get用于得到传出的值。 一般的调用代码为:

ruleEngine.put(传入对象);

ruleEngine.excute("规则包调用名");

传出对象 = ruleEngine.get("传出对象名");

02编译原理基本概念

image.png

词法分析

概念:把源代码字符串转换为词法单元(Token)的这个过程。

如何识别Token?——答案是 确定的有限自动机 DFA |  Deterministic Finite Automaton 。确定的有限自动机就是一个状态机,它的状态数量是有限的。该状态机在任何一个状态,基于输入的字符,都能做一个确定的状态转换。

语法分析

概念:词法分析是识别一个个的单词,而语法分析就是在词法分析的基础上识别出程序的语法结构。

这个结构是一个树状结构。这棵树叫做抽象语法树(Abstract Syntax Tree,AST)。树的每个节点(子树)是一个语法单元,这个单元的构成规则就叫“语法”。每个节点还可以有下级节点。

  • 上下文无关语法 Context-Free Grammar: 语言句子无需考虑上下文,就可以判断正确性。巴科斯范式(BNF) 是描述上下文无关理论的一种具体方法,其本质上就是树形分解,分解成一棵抽象语法树。

1、每个产生式就是一个子树,在写编译器时,每个子树对应一个解析函数。

2、叶子节点叫做 终结符,非叶子节点叫做 非终结符

  • 递归下降算法 Recursive Descent Parsing

基本思路就是按照语法规则去匹配 Token 串。

类型检查

  • 类型综合 :根据子表达式的类型构造出父表达式的类型。 例如,表达式A+B的类型是根据A和B的类型定义的

  • 编译时检查:需要提前声明参数的类型,在构建语法树过程中进行类型检查

  • 运行时检查:可以根据执行时的参数输入的值类型,在执行过程中进行类型检查

03设计一个规则引擎

设计目标

设计一个规则引擎,支持特定的词法、运算符、数据类型和优先级。并且支持基于以上预定义语法的规则表达式的编译和执行。

词法(合法Token)

  • 参数 : 由字母数字下划线组成 eg : _ab2、 user_name
  • 布尔值 : true 、false
  • 字符串:“abcd”、'abcd'、~abcd
  • 十进制int: 1234
  • 十进制float: 123.5
  • 预定义运算符: + -

数据类型:

  • 字符串
  • 布尔值
  • 十进制int
  • 十进制float

运算符:

  • 一元运算符: + -
  • 二元运算符: + - * / % > < >= <= == !=
  • 逻辑操作符: && || !
  • 括号: ( )

优先级:

优先级运算符
0||
1&&
2! - +
3> >= < <= == !=
4+ -
5* /
6( )

词法分析

根据设计的词法,设计词法分析的状态机。

image.png

语法分析

expr: logOr EOF;
logOr: logOr '||' logAnd | logAnd;
logAnd: logAnd '&&' logNot | logNot;
logNot: '|' logNot | cmp;
cmp: cmp '>' add | cmp '>=' add | cmp '<' add | cmp '<=' add | cmp '==' add | cmp '!=' add
add: add '+' mul | add '-' mul | mul;
pri mul '*' pri | mul '/' pri | mul '%' pri | pri;
pri: BooleanLiteral | IntegerLiteral | FloatLiteral | StringLiteral | Identifier | '('expr')';
  • 优先级的表达
type precedence struct {
    validSymbols    []symbol    //当前优先级支持的运算符类型
    nextPrecedence  *precedence // 更高优先级的
    planner         planner     //当前优先级的处理函数
  • 语法树结构

一元运算符: 左子树为空,右子树为右操作数
二元运算符: 左子树为左操作数,右子树为右操作数
括号: 左子树为空,右子树为内部表达式的AST

语法树执行与类型检查

语法树执行

预先定义好每种操作符的执行逻辑。
对抽象语法树进行后续遍历执行,即:

  • 先执行左子树,得到左节点的值
  • 再执行右子树,得到有节点的值
  • 最后根据根节点的操作符执行得到根节点的值

类型检查

检查时机: 执行时检查 检查方法: 在一个节点的左右子节点执行完成后,分别校验左右子节点的类型是否符合对应操作符的类型检查预设规则

  • 符号要求左右子节点的值都存在且为 int或float.
  • "!’符号要求左节点为空且右节点的值为 bool

代码实现

项目地址: github.com/qimengxingy…

项目工程使用Go语言并依赖了hertz框架。除此之外:

项目clone到本地后,可以执行测试脚本来测试环境的可用性。

git clone https://github.com/qimengxingyuan/young_engine.git
chmod a+x ./setup.sh
./setup.sh

脚本执行成功,则环境可以支持项目的执行。

参考资料

规则引擎 blog.csdn.net/weixin_4386…
规则引擎简介 t.zoukankan.com/jifeng-p-48…
规则引擎基础知识 blog.csdn.net/u010020726/…