前言
在开发离线语音交互产品时,唤醒词和命令词的设计直接影响用户体验。一个设计良好的唤醒词应该易于发音、识别准确且不易误触发,而命令词则需要直观易记、表达清晰。本文系统性地介绍 SmartPi 平台上唤醒词与命令词的设计规则、最佳实践以及常见问题的解决方案。
一、唤醒词设计规范
1.1 中文唤醒词规则
基本要求:
- 长度:建议 4-6 个字,4 个字最佳
- 发音:选择易开口、响度大、发音清晰的词
- 音节:音节覆盖应尽量多,差异大
避免事项:
| 类别 | 示例 | 原因 |
|---|---|---|
| 敏感词 | 政治、伟人名字、脏话 | 违规风险 |
| 口语化词汇 | "你好啊"、"在吗" | 容易在对话中误触发 |
| 多音字 | "重庆"、"重新" | 发音不统一 |
| 叠字 | "小爱小爱" | 较易误识别(部分场景可用) |
| 连续零声母 | "安安" | 发音模糊 |
| 相似结尾 | "打开空调"、"打开风扇" | 最后一个字相同容易混淆 |
推荐示例:
- "你好小智" - 标准格式,清晰响亮
- "小美小美" - 叠词但有品牌辨识度
- "智能管家" - 描述性强,发音清晰
1.2 英文唤醒词规则
基本要求:
- 长度:建议 2-4 个单词(4-6 个音节)
- 格式:CI 系列全大写用中横线连接(如
HELLO-AIR-CONDITIONER) - 格式:SU 系列用空格分开,支持大小写(如
hello air conditioning)
避免事项:
| 类别 | 示例 | 原因 |
|---|---|---|
| 日常用语 | HI、HELLO | 容易误触发 |
| 相似音节 | TURN-ON 和 TURN-OFF | 容易混淆 |
| 叠词 | HELLO-HELLO | 容易误识别 |
推荐示例:
SMART ASSISTANT- 清晰且不常见HELLO-DEVICE- 标准格式VOICE-CONTROL- 描述性强
1.3 数量限制
不同模块对唤醒词数量的支持有所不同:
| 模块系列 | 唤醒词数量限制 | 免唤醒命令词总限制 |
|---|---|---|
| SU-03T | 1-2 个 | 唤醒词 + 免唤醒 ≤ 10 |
| CI-03T | 1-2 个 | 唤醒词 + 免唤醒 ≤ 20 |
| SU-32T | 1-2 个 | 唤醒词 + 免唤醒 ≤ 10 |
| CI-33T | 1-2 个 | 唤醒词 + 免唤醒 ≤ 20 |
注意:唤醒词越多,识别难度相对增加,建议控制在 1-2 个以内。
二、命令词设计规范
2.1 命令词基本规则
格式要求:
- 一个行为的命令词允许填多条,用
|分隔 - 单条回复语不得超过 500 个字符
- 支持多音字标签
[=py]指定读音
多音字标注示例:
已调[=tiao2]至中[=zhong1]风档
拼音声调范围:1-5(1-4 对应一声到四声,5 对应轻声)
多条回复语示例:
好的收到|收到执行|已执行
触发时随机选择一条播报。
2.2 命令词设计原则
清晰性原则:
- 使用常用词汇,避免生僻字
- 词语结构完整,表达明确
- 避免过于简短的单字或双字命令
区分性原则:
- 命令词之间发音要有明显差异
- 避免使用同音词或近音词
- 相似功能的命令用不同动词开头
一致性原则:
- 同类功能使用相同动词(如"打开"系列、"关闭"系列)
- 保持与唤醒词风格一致
- 避免混合中英文(除非有明确需求)
2.3 命令词设计示例
良好设计:
| 场景 | 命令词设计 | 优点 |
|---|---|---|
| 灯光控制 | 打开台灯 | 关闭台灯 |
| 空调控制 | 打开空调 | 关闭空调 |
| 窗帘控制 | 打开窗帘 | 关闭窗帘 |
避免设计:
| 问题设计 | 问题原因 |
|---|---|
| 开灯 | 关灯 |
| 空调开 | 空调关 |
| 一号窗 | 二号窗 |
三、免唤醒命令词
3.1 免唤醒功能说明
免唤醒命令词可以在设备未唤醒的情况下直接触发语音交互,用户无需先说唤醒词。
适用场景:
- 公共场所语音交互(如电梯、展厅)
- 需要快速响应的控制场景
- 简单明确的单一指令
注意事项:
- 免唤醒词越多,误触发概率越高
- 建议控制在 5 条以内
- 避免与唤醒词发音相似
3.2 免唤醒配置方法
在智能公元平台配置:
- 进入词条设置页面
- 找到"免唤醒的命令词"配置区域
- 添加需要免唤醒的命令词
- 确保不与唤醒词重复
配置示例:
免唤醒命令词:打开灯光|关闭灯光|最大亮度|最小亮度
四、防误识别与优化
4.1 防止误识别词
生活中高频次发生且容易诱发误识别的词,可以配置为防止误识别词。
配置规则:
- 不能和唤醒词、命令词重复
- 多条词条之间用
|分隔 - 用于针对性防误识别和误唤醒
示例:
防止误识别:今天天气|明天天气|最近天气
4.2 识别灵敏度调整
识别灵敏度有三档可选:
| 档位 | 特点 | 适用场景 |
|---|---|---|
| 低 | 误识别率低,但需要发音清晰 | 嘈杂环境 |
| 中 | 平衡模式(默认) | 一般场景 |
| 高 | 容易识别,但误识别率增加 | 安静环境 |
调整建议:
- 误触发频繁时:降低灵敏度
- 识别不灵敏时:提高灵敏度
- 同时考虑环境噪声和发音清晰度
4.3 唤醒词评测功能
SmartPi 平台提供唤醒词评测功能:
- 在唤醒词配置页面点击"评测"按钮
- 查看得分和评价
- 根据评测结果优化唤醒词
评分参考:
| 得分范围 | 评价 | 建议 |
|---|---|---|
| 80+ | 优秀 | 可直接使用 |
| 60-80 | 良好 | 建议微调 |
| <60 | 需优化 | 更换唤醒词 |
五、常见问题与解决方案
5.1 唤醒词无响应
问题现象: 说出唤醒词后设备无任何反应
排查步骤:
- 检查唤醒词配置是否正确
- 确认固件已正确烧录
- 检查麦克风连接和状态
- 尝试使用默认唤醒词测试
- 调整识别灵敏度
常见原因:
| 原因 | 解决方案 |
|---|---|
| 唤醒词发音不标准 | 使用评测功能检查得分 |
| 麦克风硬件问题 | 检查连接和供电 |
| 固件未正确烧录 | 重新烧录并验证 |
| 环境噪声过大 | 开启降噪功能或更换环境 |
5.2 误唤醒频繁
问题现象: 设备经常在没有喊唤醒词时被触发
解决方案:
- 更换唤醒词
- 避免使用日常用语
- 选择更独特的词汇组合
- 增加唤醒词长度
- 调整灵敏度
- 降低识别灵敏度档位
- 使用平台评测功能验证
- 配置防误识别词
- 添加常见误触发词汇
- 定期更新防误识别词库
- 硬件优化
- 调整麦克风位置
- 增加隔音措施
- 使用指向性麦克风
5.3 命令词识别率低
问题现象: 唤醒成功后,命令词无法正常识别
解决方案:
| 问题 | 解决方案 |
|---|---|
| 命令词过于简短 | 增加到至少 4 个音节 |
| 发音相似 | 使用差异更大的词汇 |
| 多音字问题 | 使用 [=py] 标注正确读音 |
| 命令词过多 | 精简命令词数量 |
5.4 中英文混合使用
问题现象: 需要同时支持中英文命令词
解决方案:
- 中英文分别配置
- 中文命令词和英文命令词分开设置
- 不要在单条命令词中混合中英文
- 语言切换
- 部分模块支持中英文切换功能
- 需要在平台配置中启用相关选项
- 注意事项
- 英文命令词需符合格式要求
- 混合使用会增加误识别率
六、总结与建议
6.1 设计流程建议
1. 确定产品使用场景
↓
2. 列出所有需要的唤醒词和命令词
↓
3. 使用平台评测功能测试得分
↓
4. 根据评测结果优化调整
↓
5. 实际环境测试验证
↓
6. 根据反馈持续优化
6.2 核心要点回顾
| 要点 | 说明 |
|---|---|
| 唤醒词长度 | 中文 4-6 字,英文 2-4 词 |
| 避免混淆 | 与日常用语、命令词保持差异 |
| 数量控制 | 唤醒词 1-2 个,免唤醒 ≤5 条 |
| 使用评测 | 利用平台评测功能验证质量 |
| 实际测试 | 真实环境验证效果 |
| 持续优化 | 根据用户反馈调整 |
6.3 参考资源
- SmartPi 开发平台:smartpi.cn
- 平台入门教程:B 站视频
- CI-03T 免唤醒和自学习教程:[观看