规则引擎设计与实现 | 青训营

95 阅读6分钟

这是我参与[第五届青训营]伴学笔记创作活动的第6天。

课程内容:

  1. 认识规则引擎

探究规则引擎的由来、优点以及应用场景,简单了解规则引擎的组成和实现原理。

  1. 编译原理基本概念

程序员的三大浪漫之一:编译原理。介绍编译、词法分析、语法分析、抽象语法树等概念。

  1. 设计一个规则引擎

从零开始设计一个规则引擎YoungEngine,明确其对词法、语法的支持,设计编译和执行的流程。

  1. 实战演练

实战演练部分,实现规则引擎YoungEngine的各个部分,并介绍其中的几个重点实现思路。

01.认识规则引擎

举例

抖音商城要搞活动啦~ 活动期间用户购买相应的产品会获得商城积分!

image.png(if else即可)

过了几天,运营同学说,这个效果不太好,我们再改下规则,变成100-200元的赠送20,200-500元赠送90,500-800赠送100.....如此类推一直到1w。 (设置区间)

然后后面产品又脑洞大开了,觉得这个条件不够精细化,还要根据商品的标签属性,用户标签来判断。如果是新用户就乘二,如果商品是xx活动的特卖商品,积分就加多20 ... (规则引擎)

  • 输入:计算规则、商品价格、用户标签、商品属性...
  • 输出:积分
  • 规则简单容易配置、可扩展

规则引擎的定义

规则引擎是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则,并根据业务规则做出业务决策。

image.png

image.png

组成部分

  1. 数据输入:支持接受使用预定义的语义编写的规则作为策略集。比如"price > 500”接受业务的数据作为执行过程中的参数,比如价格、标签等。
  2. 规则理解:能够按照预先定义的词法、语法、优先圾、运算符等正确理解业务规则所表达的语义。
  3. 规则执行:根据执行时输入的参数对策略集中的规则进行正确的解释和执行。同时对规则执行过程中的数据类型进行检查,确保执行结果正确。

应用场景

  1. 风控对抗:与黑灰产的对抗过程中,策略研发和产品需要能够根据黑灰产特征进行快逵识别和对抗。规则引擎作为风控系统的核心,使产研人员能够不断的调整和优化对抗策略,以实现最好的风控识别效果。
  2. 活动策略运营:业务活动的运营需要及时根据用户效果反馈进行运营策略的优化和调整。引入规则引学后。可以将服务代码与业务运营逻辑解耦,提高运营策路的迭代效牢。方使新玩法的探索和效果验证。
  3. 数据分析和清洗:在数据分析系统中使用规则引擎可以便捷的实现对数据进行整理、清洗和转换。数据分析师可以根据不同的需求来自定义数据处理的规则,方便快捷的产出所需要的数据。

02.编译原理基本概念

  1. 词法分析:把源代码字符串转换为词法单元的过程。
  • 如何识别Token ?

有限自动机(Finite-State Automaton)

有限自动机就是一个状态机,它的状态数量是有限的。该状态机在任何一个状态,基于输入的字符,都能做一个确定的状态转换。

  1. 语法分析:二在调法分析的基础上识别出表达式的语法结构
  2. 抽象语法树:表达式抽象语法结构的树状表示,对于一个表达式。抬象语法树一定时唯一确定的。
  • 上下文无关语法:语言句子无需考虑上下文,就可以判断正确性,可以使用巴克斯范式BNF来表达。

  • 产生式:一个表达式可以由于=另外已知类型的表达式或者符号推导产生。

    • 内置符号:字面量(string. bool、number)标识符、运算物
    • 一个基础表达式可以由常量(string. bool.number)或标识符(identifier)
    • 一个乘法表达式可以由基础表达式或者乘法表达式基础表达式组成
  • 递归下降算法:递归下降算法就是自顶向下构造语法树,不断的对Token进行语法展开(下降).展开过程中可能会遇到递归的情况。

  1. 类型检查:验证执行的结果是否为合活的数据类型。在描象语法树中,通常会验证某节点的子节点的数据类型是否合法。
  • 类型综合

根据子表达式的类型构造出父表达式的类型。例如,表达式A+B的类型是根据A和B的类型定义的。

  • 编译时检查&运行时检查

类型检查可以发生在表达式的编译阶段,即在构造语法树的阶段﹔也可以发生在执行时的阶段。

  1. 参数注入∶在规则执行过程中,使用输入的参数值来计算语法树中的标识衿节点值的过程。

03.设计一个规则引擎

设计目标

设计一个规则引擎,支持特定的词法、运算符、数据类型和优先级。并且支持基于以上预定义语法的规则表达式的编译和执行。

  • 词法:参数、布尔值、字符串、十进制int、十进制float、预定义运算符
  • 运算符:一元运算符、二元运算符、逻辑操作符、括号
  • 数据类型:字符串、布尔值、十进制int、十进制float
  • 优先级:

image.png

设计词法分析的状态机

image.png

语法分析

image.png

优先级的表达

image.png

语法树结构

一元运算符:左子树为空,右子树为右操怍数 二元运算符:左子树为左操怍数,右子树为右操作数 括号:左子树为空,右子树为内部表达式的AST

语法树执行

  • 预先定义好每种操作符的执行逻辑。

  • 对抽象语法树进行后续遍历执行,即:

    • 先执行左子树,得到左节点的值
    • 再执行右子树,得到有节点的值;
    • 最后根据根节点的操作符执行得到根节点的值。

检查类型

  • 检查时机:执行时检查

  • 检查方法:在一个节点的左右子节点执行完成后,分别校验左右子节点的类型是否符合对应操作符的类型检查预设规则。

    • ‘>’符号要求左右子节点的值都存在且为int或float
    • ‘!’符号要求左节点为空且右节点的值为bool