这是我参与「第五届青训营 」伴学笔记创作活动的第 9 天
今天和大家分享规则引擎的概念和其背后的核心原理。
规则引擎的设计与核心原理
基础概念
规则引擎是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接收数据输入,解释业务规则,并且根据业务规则做出业务决策。
在真正的业务场景中,通常是代替了规则修改 -> 业务人员整合 -> 开发人员修改(代码层面) -> 实现新的业务逻辑成为规则修改 -> 业务人员整合并在平台层面修改 -> 实现新的业务逻辑;作为一名前端开发人员,我觉得这更像一种后端的低代码模型,将规则修改提升到了业务人员层面,通过“鼠标点点点”,来完成原本需要开发人员参与的规则修改工作。
组成部分:
- 数据输入:接收预定义的语义编写的规则作为策略集。比如“price > 500”和执行过程中的参数,比如价格,标签;
- 规则理解:按照预定义的词法,语法,优先级,运算符等正确理解业务规则所表达的语义;
- 规则执行:根据策略集进行正确解释和执行。
应用场景:
- 风控对抗:优化对抗策略以实现最好的风控识别效果;
- 活动运营策略:根据用户效果和反馈实施优化策略;
- 数据分析和清洗:使用规则引擎更加方便快捷的处理数据。
核心原理
编译原理
规则引擎本身就是在做编译:
- 对业务人员的输入进行此法分析和语法分析,最终理解。
- 词法分析:把源代码字符串转换为此法单元(Token)的过程。例如 price > 500 分割成price,>,500
- 语法分析:在词法分析的基础上识别表达式的语法结构
- 对分析出的语法结构构建抽象语法树。
- 对类型进行校验,判断规则合法性,并且进行执行。
词法分析:
如何识别一个token(语法单元)?
使用一个有限自动机:有限自动机是一个状态机,它的状态数量是有限的。该状态及在任何一个状态,基于输入的字符,都能做一个确定的状态转换。
例如上面的图,当遇到一个英文字母时,循环去读,知道遇到空格或其他特殊标识,得到一个参数。
同时,词法分析也要分析出当前词的类型和优先级。常见的词可以分为:
语法分析:
语法分析就是在词法分析的基础上,识别表达式的语法构建的过程。例如,price > 500 被构建成了抽象语法树:
> 操作数
/ \
price 左操作数 500 又操作数
这里的抽象语法树有这么几个概念:
- 上下文无关语法:语言句子我们无需要考虑上下文就可以判断出其正确性。
- 递归下降算法:递归下降算法就是不断的对Token进行语法展开(下降)直到遇到分号等结束符。这中间可能会遇到一些递归的情况。
- 类型检查:根据子表达式的类型构造出父表达式的类型,例如
a=b+c,b和c是int类型,所以a应该是一个int类型而不是其他类型
语法树执行和类型检查:
- 语法树执行就是对树进行后续遍历,即:先执行左子树得到左子树的值,在执行右子树得到右子树的值,最后根据根节点的操作符得到根节点的值。
- 类型检查就是根据上述的类型检查手法再运行时或者编译时进行类型检查。