《大模型工程化》第9章读书笔记

8 阅读1分钟

第9章 需求理解算法

9.1 从模糊需求到清晰需求

(1) 通过需求理解算法,可以补充缺乏的业务知识,对有歧义的内容进行澄清,从而生成准确的SQL查询代码。

(2) 面临的挑战:知识形式多样、知识定义可变、知识零散分布、知识持续新增、知识复杂表述

9.2 常见的需求理解算法

(1) 传统Query理解算法:

  • query预处理:归一化(大小写转换/繁简体转换/全半角转换)、长度截断、运营审核
  • query分词:开源分词工具
  • query改写:query纠错模块纠正Query中的错误信息、query扩展模块推荐高频相似query弥补召回不足问题、query归一模块解决同义词问题
  • term分析:term权重分析,TF-IDF算法
  • 意图识别:意图分类算法

(2) 创新需求理解算法

  • 构建业务知识库:
    • 定义业务知识:设计统一的业务知识管理模板
    • 业务知识抽取:使用规则、使用提示工程技术(少样本提示和链式思考提示技术)
  • 构建需求理解链路:
    • 需求澄清模块和需求改写模块可以基于提示工程技术,通过大模型来完成。