这是我参与「第五届青训营」伴学笔记创作活动的第5天。
1 目标
1.1 理解规则引擎的组成部分及应用场景
1.2 理解规则引擎的核心原理-编译原理的相关概念
1.3 设计并实现一个规则引擎-YoungEngine
1.4 结合之前学习,实现一个Web版规则引擎(自行实现)
2 课程目录
2.1 认识规则引擎
2.1.1 什么是规则引擎
定义:规则引擎是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则,并根据业务规则作出业务决策。
解决开发人员重复编码问题,业务决策与服务本身解耦,提高服务的可维护性,缩短开发路径。
2.1.2 组成部分
数据输入:支持接受使用预定义的语义编写的规则作为策略集。
规则理解:能够按照预定义的词法、语法、优先级、运算符等正确理解业务规则所表达的语义。
规则执行:根据执行输入的参数对策略集中的规则进行正确的解释和执行。同时对规则执行过程中的数据类型进行检查,确保执行结果正确。
2.1.3 应用场景
(1)风控对抗:与黑灰产的对抗过程中,策略研发和产品需要能够根据黑灰产特征进行快速识别和对抗。
(2)活动策略运营:业务活动的运营集中及时根据用户效果反馈进行运营策略的优化和调控。
(3)数据分析和清洗:在数据分析系统中使用规则引擎可以便捷的实现对数据进行整、清洗和转换。
2.2 编译原理基本概念
规则引擎编译原理简单可以分为三个步骤:
理解:词法分析、语法分析
执行:抽象语法树
输入输出:参数注入、类型检查
2.2.1 词法分析
定义:把源代码字符串转换为词法单元的这个过程。
有限自动机:一个状态机,它的状态数量是有限的。该状态机在任何一个状态,基于输入的字符,都能做一个确定的状态转换。
2.2.2 语法分析
定义:在词法分析的基础上,识别表达式的语法结构的过程。
2.2.3 抽象语法树
表达式的语法结构可以用树来表达,其每个节点(子树)是一个语法单元,这个单元的构成规则就叫“语法”。每个节点还可以有下级节点。
上下文无关语法:语言句子无需考虑上下文,就可以判断正确性。可以使用巴科斯范式(BNF)来表达。
递归下降算法:就是自项向下构造语法树,不断的对Token进行语法展开(下降)。展开过程中可能会遇到递归的情况。
2.2.4 类型检查
类型综合:根据子表达式的类型构造出父表达式的类型。例如,表达式A+B的类型是根据A和B的类型定义的
编译时检查 & 运行时检查:类型可以发生表达式的编译阶段,即在构造语法树的阶段;也可以发生在执行时的阶段。
2.3 设计一个规则引擎
2.3.1 设计目标
设计一个规则引擎,支持特定的词法、运算符、数据类型和优先级。并且支持基于以上预定义语法的规则表达式的编译和执行。
词法分析:
参数:由字母数字下划线组成
布尔值:true、false
字符串:“abcd”
十进制int:1234
十进制float:123.5
一元运算符:+-
二元运算符:+-* / % > < >= <= == !=
逻辑操作符:&& || !
括号:()
设计词法分析的状态机:
语法分析:
2.3.2 语法树执行与类型检查
语法树执行:
预先定义好每种操作符的执行逻辑。
对抽象语法树进行后缀遍历执行。
类型检查:
检查时机:执行时检查
检查方法:在一个节点的左右子节点执行完成后,分别校验左右子节点的类型是否符合对应操作符的类型检查预设规则。