命名实体识别(NER)是将非结构化文本中的关键信息(人名、地名、机构名、特定业务字段)结构化提取的关键技术。传统做法依赖AI团队训练和维护模型,业务规则一变化就要重新迭代,响应周期长。
将NER能力以低代码工作流的方式集成,允许业务人员通过可视化方式编排“文本处理流水线”,让不懂AI的团队也能自主构建智能文本分类和信息提取应用。
一、为什么需要低代码实体识别
以客服工单分类场景为例:每天数千条工单需要根据内容自动归类。传统模式下,每次新增产品线、调整优先级规则,都需要AI团队重新标注数据、训练模型、部署服务,排期以周为单位。业务响应速度被技术瓶颈卡死。
低代码实体识别的核心价值在于:
- 业务自主权:产品经理或运营人员通过拖拽界面即可调整分类规则,无需等待技术排期。
- 实时生效:规则修改后立即应用,不依赖模型重新训练和发布。
- 多模态识别:结合关键词、正则、AI模型等多种方式,兼顾准确率和灵活性。
二、核心架构:模型服务化与可视化编排
JNPF的低代码实体识别能力,并非将AI模型内置到引擎核心,而是采用**“模型即服务”+“可视化编排”**的松耦合架构:
- 模型服务层:底层封装高性能NER模型(如基于RaNER、BERT的模型),以API或gRPC服务形式暴露。支持GPU加速,可独立部署和横向扩展。
- 工作流编排层:在JNPF的可视化设计器中,将模型调用封装为标准的“AI节点”。用户拖拽节点、配置参数、连接数据流,即可构建完整的文本处理流水线。
- 数据映射层:负责将上游数据(如工单文本)转换为模型输入格式,并将模型输出的结构化JSON结果,通过字段映射自动写入业务系统的对应字段(如“紧急程度”、“产品类型”、“客户情绪”)。
三、可视化工作流构建:从“编码”到“编排”
在JNPF中,构建一个工单智能分类流程,不再需要编写Python代码调用模型,而是通过拖拽完成:
典型流水线结构:
[数据源节点] → [预处理节点] → [实体识别节点] → [规则节点] → [输出节点]
- 数据源节点:支持从多种渠道接入文本数据,如数据库(SQL查询)、API请求(企业微信/钉钉回调)、消息队列(Kafka/RabbitMQ)。
- 预处理节点:内置常见文本清洗算子,如去除空格、特殊符号、分词(可对接Jieba/HanLP)、正则提取。
- 实体识别节点:这是核心。JNPF将不同类型的NER能力封装为可配置节点:
- 关键词匹配节点:基于自定义词典和AC自动机算法,实现高速精准匹配,适合产品名、故障码等固定实体。
- 正则表达式节点:通过图形化方式配置正则,用于提取订单号、日期、电话号码等模式固定的实体。
- 深度学习模型节点:调用预训练NER模型,识别人名、地名、机构名及复杂语义实体。节点可配置模型版本、温度参数、返回置信度阈值等。
- 规则节点:利用JNPF的规则引擎,对上游识别的实体进行逻辑判断,最终决定分类或下一步动作。规则支持图形化配置(决策表、脚本模式),也可手写表达式(如
if 实体.情绪 == '愤怒' && 实体.产品类别 == '手机' then 分类='紧急投诉')。 - 输出节点:将最终结果写入目标系统,如更新数据库字段、调用第三方API、创建企业微信通知等。
四、实战案例:电商售后工单分类
以电商售后工单为例,展示完整搭建步骤:
1. 实体提取层配置
- 添加“关键词匹配”节点,录入产品品类词库(手机/家电/服饰),匹配模式设为“包含即识别”。
- 添加“正则表达式”节点,配置提取订单号的规则,如
[A-Z]{3}-\d{8}。 - 添加“深度学习模型”节点,选择预置的“情感分析”模型,识别工单中的情绪倾向(愤怒/一般/满意)。
2. 规则决策层配置 添加“规则引擎”节点,配置以下逻辑:
if 情绪 == "愤怒" and 产品品类 == "家电" then 分类 = "家电紧急投诉"elif 订单号 in 本月促销订单 then 标记 = "促销订单优先处理"else 分类 = "常规咨询"
3. 输出配置 添加“企业微信”节点,将分类结果和工单内容发送至对应处理群组;同时添加“数据库更新”节点,将工单状态同步至CRM系统。
4. 实时测试与发布 设计界面右侧常驻测试面板,可随时输入样本数据,查看每个节点的中间输出。确认无误后点击“发布”,系统自动生成RESTful API端点,供外部系统调用。
五、技术要点与优化建议
1. 关键词库维护
- 同义词扩展:如“死机”≈“卡顿”≈“无响应”,可通过配置同义词表提升召回率。
- 分层管理:将关键词按类别分层(如手机类故障、物流问题),便于维护和复用。
2. 正则表达式调试 常见问题及解决方案:
- 匹配过度:如
\d+会匹配所有数字,应限定长度和格式,如^\d{6}$只匹配6位纯数字。 - 中文提取:提取“订单号:中文编号”中的中文,可用
(?<=订单号:)[\u4e00-\u9fa5]+。
3. 规则引擎最佳实践
- 优先级排序:将高频规则放在前面,减少判断次数。
- 兜底规则:设置默认分类,如
if not 其他所有规则匹配: 分类 = "常规咨询"。 - 测试集验证:准备100-200条典型工单,批量运行后计算准确率,重点分析误分类案例。
六、总结
将NER能力以低代码工作流方式提供,本质上是在AI模型的专业壁垒和业务敏捷性之间架起一座桥梁。它让模型不再是躺在服务器上的“黑盒API”,而是业务人员手中可随时调整、实时验证的“智能积木”。
在JNPF这类平台上,技术团队的角色从“为业务写代码”转变为“封装AI能力、治理数据、维护平台”,而业务团队则获得了定义和优化智能流程的自主权。这种协作模式,或许是企业在落地AI能力时更高效、更可持续的路径。