认识规则引擎
定义
规则引擎是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则。并根据业务规则作出业务决策。
组成部分
- 数据输入,支持接受使用预定义的语义编写的规则作为策略集。比如“price > 500”
- 规则理解,能够按照预先定义的词法,语法,优先级,运算符等正确理解业务规则所表达的语义
- 规则执行,根据执行时输入的参数对策略集中的规则进行正确的解释和执行。同时对规则执行过程中的数据类型进行检查,确保结果正确
应用场景
- 风控对抗
- 活动策略运营
- 数据分析和清洗
编译原理基本概念
词法分析
将源代码字符串转换为词法单元(Token)的这个过程
如何识别Token
有限自动机
有限自动机是一个状态机,他的状态数量有限。该状态机在任何一个状态,基于输入都有一个确定的转换。
语法分析
在词法分析的基础上,识别表达式的语法结构
抽象语法树
price > 500 && (isNew || (level > 5))
表达式的语法结构可以用树来表示,其每个节点(子树,也是第一步的token)是一个语法单元,这个单元的构成规则就叫“语法”。每个节点还可以有下级节点。
上下文无关语法
句子不需要考虑上下文就可以判断正确性。可以使用巴克斯范式(BNF)来表达。
递归下降算法
自顶向下构造语法树
不断的对token进行语法展开(下降),展开过程中可能遇到递归情况
类型检查
-
类型综合,根据子表达式的类型构造父表达式的类型。例如A+B的类型是根据A和B的类型来定义的
-
编译时检查和运行时检查。
- 编译阶段检查就是在构造语法树阶段
- 运行时检查是拿到真正数据的时候进行检查
设计目标
设计一个规则引擎,支持特定的词法、运算符、数据类型和优先级。并且支持基于以上预定义语法的规则表达式的编译和执行
词法分析
设计状态机