第9章 需求理解算法
9.1 从模糊需求到清晰需求
(1) 通过需求理解算法,可以补充缺乏的业务知识,对有歧义的内容进行澄清,从而生成准确的SQL查询代码。
(2) 面临的挑战:知识形式多样、知识定义可变、知识零散分布、知识持续新增、知识复杂表述
9.2 常见的需求理解算法
(1) 传统Query理解算法:
- query预处理:归一化(大小写转换/繁简体转换/全半角转换)、长度截断、运营审核
- query分词:开源分词工具
- query改写:query纠错模块纠正Query中的错误信息、query扩展模块推荐高频相似query弥补召回不足问题、query归一模块解决同义词问题
- term分析:term权重分析,TF-IDF算法
- 意图识别:意图分类算法
(2) 创新需求理解算法
- 构建业务知识库:
-
- 定义业务知识:设计统一的业务知识管理模板
- 业务知识抽取:使用规则、使用提示工程技术(少样本提示和链式思考提示技术)
- 构建需求理解链路:
-
- 需求澄清模块和需求改写模块可以基于提示工程技术,通过大模型来完成。