这是我参与「第五届青训营 」伴学笔记创作活动的第 3 天
认识规则引擎
什么是规则引擎
假如进行一个促销活动,实行满减优惠,消费分为几个档次,根据档次定义满减额度。
如果直接编码解决其实没有什么难度,但是将这些逻辑写入硬编码,假如以后需要频繁更改,那开发同学恐怕就要磨刀霍霍了
因此,我们想找一种输入计算规则和价格等信息,自动进行相关处理并输出结果的一个工具
要求:规则简单容易配置、易扩展
定义
规则引擎是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则,并根据业务规则做出业务决策。
- 解决开发人员重复编码的问题、
- 业务决策与服务本身解耦,提高服务的可维护性
- 缩短开发路径,提高效率
规则引擎的组成
- 数据输入 支持接受使用预定义的语义编写的规则作为策略集。比如“price > 500” 接受业务的数据作为执行过程中的参数,比如价格、标签等
- 规则理解 能够按昭预先定义的词法、语法、优先级、运算符等正确理解业务规则所表达的语义。
- 规则执行 根据执行时输入的参数对策略集中的规则进行正确的解释和执行。同时对规则执行过程中的数据类型进行检查,确保执行结果正确
规则引擎的应用场景
- 风控对抗 与黑灰产的对抗过程中,策略研发和产品需要能够根据黑灰产特征进行快速识别和对抗。规则引擎作为风控系统的核心,使产研人员能够不断的调整和优化对抗策略,以实现最好的风控识别效果。
- 活动策略运营 业务活动的运营需要及时根据用户效果反馈进行运营策略的优化和调整。引入规则引擎后,可以将服务代码与业务运营逻辑解耦,提高运营策略的迭代效率。方便新玩法的探索和效果验证
- 数据分析与清洗 在数据分析系统中使用规则引擎可以便捷的实现对数据进行整理、清洗和转换。数据分析师可以根据不同的需求来自定义数据处理的规则,方便快捷的产出所需要的数据。
编译原理基本概念
词法分析
把源代码字符串转换为词法单元(Token)的这个过程
比如一个句子:我饿了,正常人会把它划分为:我 饿 了 三个部分。同样的,对于输入,规则引擎会根据一定的规则将其分割为词法单元。
如何识别Token ?
有限自动机(Finite-State Automaton)
有限自动机就是一个状态机,它的状态数量是有限的。该状态机在任何一个状态,基于输入的字符,都能做一个确定的状态转换。
以输入 price > 500 && ( isNewUser || userLevel > 5 ) 为例,其有限状态自动机的图示如下:
语法分析
在词法分析的基础上识别出表达式的语法结构
之前将输入分割为了词法单元,现在就该找出词法单元之间的关系了:比如一个操作符的左操作数与右操作数,上面的例子中,price 和 500 就是 > 的左右操作数
这样的关系,很容易让人联想到树结构——也就是将他们之间的关系转化为抽象语法树
抽象语法树
表达式抽象语法结构的树状表示,对于一个表达式,抽象语法树一定是唯一确定的
如上图,之前的例句就可以转化为这样的一个抽象语法树,并且只有这一种确定的结构
表达式的语法结构可以用树来表示,其每个节点(子树)是一个语法单元,这个单元的构成规则就叫“语法”。每个节点还可以有下级节点。
上下文无关语法
语言句子无需考虑上下文,就可以判断正确性,可以使用巴科斯范式(BNF)来表达
BNF是John Backus 在20世纪90年代提出的用以简洁描述一种编程语言的语言。
基本结构为:
<non-terminal> ::= <replacement>non-terminal 意为非终止符,就是说我们还没有定义完的东西,还可以继续由右边的 replacement,也就是代替物来进一步解释、定义。
exp: add;
add: add '+' mul | mul;
mul: mul '*' pri | pri;
pri: string | bool | number | identifer
产生式:一个表达式可以由另外已知类型的表达式或者符号推导产生
内置符号:字面量(string、bool、number)标识符、运算符 一个基础表达式可以由常量(string、bool、number)或标识符(identifier)一个乘法表达式可以由基础表达式或者乘法表达式 * 基础表达式组成
巴科斯范式的思维带有递归的意味,不断通过更低等级的表达式描述自身
递归下降算法 Recursive Descent Parsing
递归下降算法就是自顶向下构造语法树
不断的对Token进行语法展开(下降),展开过程中可能会遇到递归的情况。
类型检查
**类型检查:**验证执行的结果是否为合适的数据类型。在抽象语法树中,通常会验证某节点的子节点的数据类型是否合法 **参数注入:**在规则执行过程中,使用输入的参数 值来计算语法树中的标识符节点值的过程
类型综合
根据子表达式的类型构造出父表达式的类型。例如,表达式 A+B 的类型是根据 A 和 B 的类型定义的
编译时检查&运行时检查
类型检查可以发生在表达式的编译阶段,即在构造语法树的阶段;也可以发生在执行时的阶段
- 编译时:需要 提前声明 参数的类型,在构建语法树过程中进行类型检童
- 执行时:可以根据执行时的参数输入的值类型,在执行过程中进行类型检查