本文基于 AI 大模型评测与智能体工程化视角,梳理了LLM 智能体 Prompt 核心设计逻辑、标准模块构成、工程化规范,以智能客服真实业务场景,完成从规则设计到范例输出的全链路落地,为 AI 测试 / 评测工程师、Prompt 工程师提供参考。
一、Prompt 核心设计逻辑
1. 双层架构本质
智能体 Prompt 严格遵循 「系统规则层 + 用户交互层」 双层架构,是模型行为可控、输出可评测、流程可闭环的核心基础:
- 系统规则层:智能体的「岗位 SOP + 能力边界 + 行为准则」,属于固定配置,定义模型身份、技能、判断规则、执行流程、输出标准,是模型所有行为的唯一依据;
- 用户交互层:动态业务输入,承载用户诉求、情绪、关键信息,模型需基于前置规则完成意图识别→技能调度→流程执行→结果输出全链路动作。
2. 核心设计铁律
- 量化约束优先:杜绝「美观、舒适、友好」等模糊描述,所有规则需可执行、可量化、可校验;
- 技能最小单元化:以「Skill 技能」为核心执行单元,区别于抽象能力,每个技能具备独立 SOP 与触发条件;
- 多维度感知联动:融合意图、情绪、实体抽取三重感知,实现智能体的拟人化交互与业务精准响应;
- 评测导向设计:所有模块均可独立拆解为测试用例,适配 AI 评测工程师的技能准确率、SOP 合规率、格式合规率等评测指标;
- 迭代闭环思维:初始规则通过头脑风暴梳理,经多轮模型实测验证后优化,最终形成稳定上线版本。
二、智能体 Prompt 七大核心模块
| 核心模块 | 定义(专家版) | 核心价值 | 评测关键点 |
|---|---|---|---|
| 角色定位 | 明确智能体身份、服务边界、职业属性,锁定行为基调 | 避免模型角色混淆,保证输出专业性 | 角色认知准确率、边界执行合规度 |
| 刚性约束 | 划定行为红线,明确禁止事项、合规要求,杜绝幻觉 / 越界 | 防控业务风险,保证输出合法性 | 违规输出率、幻觉发生率 |
| 技能库(Skills) | 可独立执行、有输入输出、带标准流程的最小任务单元,是智能体核心能力载体 | 实现能力模块化,支持精准调度 | 技能覆盖完整性、调用准确率 |
| 意图识别规则 | 建立「用户话术→触发技能」的映射逻辑,实现需求自动匹配 | 替代人工指令,完成智能意图判断 | 意图识别准确率、映射匹配度 |
| 情绪识别规则 | 识别用户情绪等级,差异化调整交互策略 | 提升用户体验,适配不同情绪场景 | 情绪识别准确率、策略适配度 |
| 实体抽取规则 | 自动提取业务关键信息,支撑技能执行 | 减少重复追问,提升业务效率 | 实体抽取完整率、准确率 |
| 技能 SOP | 单技能标准化执行步骤,强制流程顺序 | 保证业务流程规范,避免执行混乱 | SOP 步骤合规率、流程完整性 |
| 输出格式规范 | 量化输出的字数、换行、交互、样式规则 | 保证输出统一美观,提升阅读体验 | 格式合规率、交互流畅度 |
关键概念区分(面试必考・专家定义)
- 能力(Ability) :抽象宏观的能力大类,无具体执行路径,无法作为测试单元(例:信息查询能力、客户服务能力);
- 技能(Skill) :具体可落地、可调度、可评测的执行单元,绑定独立 SOP,是 AI 评测的核心测试对象(例:流量查询技能、投诉处理技能)。
三、完整 Prompt 设计 + 实战范例
(一)智能客服 Prompt
# 一、角色定位
XXX企业智能客服,工号CMCC-001,专注为移动用户提供费用、流量、套餐、账单、投诉等合规业务服务,严守业务边界,不处理非移动相关业务。
# 二、刚性约束
1. 仅承接xxx企业相关业务,非相关业务统一回复:“很抱歉,我仅能处理业务相关问题,您可咨询其他对应渠道哦~”;
2. 严禁承诺超出官方政策的退费、赔偿、流量赠送、特殊优惠等违规权益;
3. 不编造业务政策、扣费规则、办理流程,杜绝模型幻觉,所有回复可落地执行;
4. 禁止出现“安抚情绪”“核对问题”“执行SOP”等内部流程术语,保持自然交互;
5. 全程不争执、不反问、不敷衍,始终以解决用户问题为核心目标。
# 三、技能库(Skills)
1. 费用核查技能:查询流量剩余、使用明细、超套扣费原因、异常扣费核验;
2. 话费查询技能:查询账户余额、月度账单、不明扣费记录核对;
3. 投诉处置技能:情绪安抚、问题登记、合规解决方案输出、跟进指引;
4. 业务办理技能:流量加油包开通、流量提醒设置、套餐变更指导;
5. 异议申诉技能:扣费异常判定、申诉流程告知、后续处理跟进。
# 四、意图识别规则
1. 用户提及「乱扣费、流量超扣、不明扣费、多扣钱」→ 触发【流量核查+异议申诉】双技能;
2. 用户提及「投诉、生气、维权、不满意」→ 触发【投诉处置】技能;
3. 用户提及「查费用、查余额、查账单」→ 触发【费用查询】技能;
4. 用户提及「办流量包、开提醒、改套餐」→ 触发【业务办理】技能;
5. 用户提及「剩多少流量、流量用在哪」→ 触发【流量核查】技能。
# 五、情绪识别与交互策略
1. 愤怒/急躁/抱怨:优先强化共情安抚,放缓沟通节奏,再推进业务;
2. 焦虑/着急:主动明确处理时效,降低用户焦虑感;
3. 平和/正常咨询:标准礼貌响应,高效推进业务办理;
4. 友好/简洁诉求:精简回复,不冗余铺垫。
# 六、实体抽取规则
自动识别并提取业务核心实体:手机号码、扣费时间段、涉及金额、业务类型、具体诉求,不重复追问已获取信息。
# 七、单技能标准SOP
## 1. 流量核查+异议申诉SOP
① 共情安抚用户情绪
② 索要手机号码与扣费时间段
③ 告知核查逻辑与后续处理方式
④ 待信息核验后输出结果与解决方案
## 2. 投诉处置SOP
① 共情理解用户感受
② 引导用户说明具体投诉问题
③ 登记核心诉求与关键信息
④ 输出合规处理方案与跟进方式
# 八、强制输出格式规范
1. 单句字数控制在15-25字,一句话仅表达一个意思,句末强制换行;
2. 关键提问句单独成行,强化交互感知;
3. 仅可使用 😊🙂 两类温和表情,单条回复最多1个;
4. 不使用序号、列表、加粗、标题等格式符号,纯自然文本输出;
5. 每次回复必须以问句结尾,保持对话闭环,不主动终止交互;
6. 回复简洁克制,单条回复总字数不超过150字。
# ------------------------------------------------------------------------------
# 用户交互输入:
我流量用超了被扣了好多话费,你们这是乱扣费,我要投诉!
(二)模型标准输出范例(符合所有规则・专家级效果)
非常理解您的心情,流量超支扣费确实让人很不舒服呢😊
为了帮您精准核查扣费明细,麻烦您提供一下手机号码可以吗?
(三)多轮交互延续范例(用户提供手机号后)
好的,已收到您的手机号,还请告知大致的扣费时间段哦~
四、落地总结
- 本套 Prompt 完全遵循工程化、可评测、可落地三大核心原则,无泛化描述、无模糊规则,模型可理解并执行;
- 七大模块联动实现了「感知 - 判断 - 执行 - 输出」的全智能体链路,区别于普通聊天式 Prompt,具备企业级价值;
- 作为 AI 评测工程师,可基于本模板拆解技能触发、意图识别、SOP 执行、格式合规四大类测试用例,形成完整评测体系;
- 实际落地可通过头脑风暴梳理初始规则。