这是我参与「第五届青训营 」笔记创作活动的第7天。注:笔记大部分图片内容及代码段为青训营课程视频提供,仅交流,不得做个人使用
一、本节主要内容
·理解规则引擎的组成部分及应用场景
·理解规则引擎的核心原理-编译原理的相关概念
·设计并实现一个规则引擎一YoungEngine
·结合之前所学课程,实现一个Web版规则引擎(自行实现)
二、本节详细知识点
- 认识规则引擎
探究规则引擎的由来、优点以及应用场景。简单了解规则引擎的组成和实现原理。 - 编译原理基本概念 程序员的三大浪漫之一:编译原理。介绍编译、词法分析、语法分析、抽象语法树等概念。
- 设计一个规则引擎
从零开始设计一个规则引擎YoungEngine,明确其对词法、语法的支持,设计编译和执行的流程。 - 规则引擎的实现 实战演练部分,实现规则引擎YoungEngine的各个部分,并介绍其中的几个重点实现思路。
认识规则引擎
什么是规则引擎 | 规则引擎的组成 | 规则引擎的应用场景
什么是规则引擎
规则引擎是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则,并根据业务规则做出业务决策。
· 解决开发人员重复编码的问题业务决策与服务本身解耦,提高服务的可维护性缩短开发路径,提高效率
组成部分
- 数据输入
支持接受使用预定义的语义编写的规则作为策略集。比如“price > 500 " 接受业务的数据作为执行过程中的参数,比如价格、标签等 - 规则理解 能够按照预先定义的词法、语法、优先级、运算符等正确理解业务规则所表达的语义。
- 规则执行 根据执行时输入的参数对策略集中的规则进行正确的解释和执行。同时对规则执行过程中的数据类型进行检查,确保执行结果正确
应用场景
- 风控对抗
与黑灰产的对抗过程中,策略研发和产品需要能够根据黑灰产特征进行快速识别和对抗。规则引擎作为风控系统的核心,使产研人员能够不断的调整和优化对抗策略,以实现最好的风控识别效果。 - 活动策略运营
业务活动的运营需要及时根据用户效果反馈进行运营策略的优化和调整引入规则引擎后,可以将服务代码与业务运营逻辑解耦,提高运营策略的迭代效率。方便新玩法的探索和效果验证 - 数据分析和清洗 在数据分析系统中使用规则引擎可以便捷的实现对数据进行整理、清洗和转换。数据分析师可以根据不同的需求来自定义数据处理的规则,方便快捷的产出所需要的数据。
编译原理和基本概念
词法分析 | 语法分析 | 抽象语法树 | 类型检查
词法分析Lexical Analysis
词法分析就是把源代码字符串转换为词法单元(Token)的这个过程。
如何识别Token?
有限自动机(Finite State Automaton) 有限自动机就是个状态机,它的状态数量是有限的。该状态机在任何一个状态基于输入的字符都能做一个确定的状态转换。
语法分析SyntaxAnalysis
语法分析就是在词法分析的基础上,识别表达式的语法结构的过程
- 抽象语法树 表达式的语法结构可以用树来表示,其每个节点(子树)是一个语法单元,这个单元的构成规则就叫“语法每个节点还可以有下级节点。
抽象语法树Abstract Syntax Tree
- 上下文无关语法Context-Free Grammar
语言句子无需考虑上下文,就可以判断正确性。可以使用巴科斯范式(BNF)来表达
- 产生式:一个表达式可以由另外已知类型的表达式或者符号推导产生
· 内置符号:字面量(string、bool、number)标识符、运算符
· 一个基础表达式可以由常量(string、bool、number)或标识符(identifier)
· 一个乘法表达式可以由基础表达式或者乘法表达式*基础表达式组成
- 递归下降算法RecursiveDescentParsing
递归下降算法就是自顶向下构造语法树不断的对Token进行语法展开(下降),展开过程中可能会遇到递归的情况
类型检查
- 类型综合
根据子表达式的类型构造出父表达式的类型。例如表达式A+B的类型是根据A和B的类型定义的
无法确实时,需返回失败
- 编译时检查&运行时检查
类型检查可以发生在表达式的编译阶段,即在构造语法树的阶段;也可以发生在执行时的阶段
· 编译时:需要提前声明参数的类型,在构建语法树过程中进行类型检查
int1 : int; str1 :string
· 执行时:可以根据执行时的参数输入的值类型,在执行过程中进行类型检查
int1 : 108; str1: "300"
设计一个规则引擎
设计目标 | 词法与语法 | 优先级与语法树
设计目标
设计一个规则引擎,支持特定的词法、运算符、子、数据类型和优先级。并且支持基于以上预定义语法的规则表达式的编译和执行
词法分析
设计词法分析的状态机
ps:11状态采用预读策略,后接=则为12,不是则为11
语法分析
定义的巴克斯范式
- 优先级的表达
type precedence struct{
validSymbols []Symbol //当前优先级支持的运算符类型
nextPrecedence *precedence //更高优先级的
planner planner //当前优先级的处理函数
- 语法树的结构
一元运算符:左子树为空,右子树为右操作数
二元运算符:左子树为左操作数,右子树为右操作数括号:左子树为空,右子树为内部表达式的AST
语法树的执行与类型检查
- 语法树执行
预先定义好每种操作符的执行逻辑。
对抽象语法树进行后续遍历执行,即:
先执行左子树,得到左节点的值;
再执行右子树,得到有节点的值;
最后根据根节点的操作符执行得到根节点的值。
- 类型检查
检查时机:执行时检查
检查方法:在一个节点的左右子节点执行完成后,分别校验左右子节点的类型是否符合对应操作符的类型检查预设规则。
“>”符号要求左右子节点的值都存在且为int或float.
“!”符号要求左节点为空且右节点的值为bool
实践部分
github.com/qimengxingy…
作者:青训营官方账号
链接:juejin.cn/post/719336…
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
项目环境:
go语言环境搭建
需要安装docker环境
安装docker-compose工具
www.runoob.com/docker/dock… 项目clone到本地后,可以执行测试脚本来测试环境的可用性。如果有错误欢迎百度和Google解决
git clone https://github.com/qimengxingyuan/young_engine.git
chmod a+x ./setup.sh
./setup.sh