一、 活动背景
回顾 2025 年,AI 眼镜行业经历了从“极客玩具”到“实用工具”的关键转变。在激烈的“百镜大战”中,我们迎来了 2026 丙午马年。作为开发者,我们不仅关注硬件的参数,更关心应用如何落地。
春节,是中国人一年中情感最浓郁、社交最密集的时刻。但随之而来的,是年夜饭桌上长辈们关于“催婚、工资、买房”的连环拷问。作为一名能写代码绝不说话的典型开发者,我一直在思考:如何利用 Rokid 灵珠(Rizon)AI 平台,在不冒犯长辈的前提下,利用 AR 技术给我自己做一个“高情商提词器”?
本期征文,我将分享如何利用灵珠平台的知识库(Knowledge Base)+ 工作流(Workflow) ,构建一个名为“灵马社交助手”的应用。
二、 核心架构
在开发之初,我曾考虑过直接调用大模型的通用回复能力。但实验后发现,大模型的回答往往“AI 味”太重,比如会说:“我建议你可以尝试幽默地回答这个问题...”。在 AR 眼镜端,这种多余的废话会瞬间遮挡视线。
因此,我选择了基于 RAG(检索增强生成) 的私有知识库方案。其核心逻辑如下:
- 确定性:回复内容完全来自于我们预设的高情商话术表。
- 极简性:强制提取 15 字以内的“金句”,实现一瞥即知(Glanceable)。
- 实时性:通过灵珠的向量检索,在 1 秒内完成从“听到提问”到“弹出提示”的全过程。
三、 第一步:构建符合业务逻辑的“社交秘籍”知识库
这是整个应用的底层资产。我们要准备一份包含特定字段的 CSV 文件。
1. 知识库表结构设计
根据实战需求,我设计了包含四个核心字段的表结构,并针对马年场景填充了话术:
| 场景分类 | 常见提问(检索项) | 高情商回复建议(输出项) | 核心策略 |
|---|---|---|---|
| 婚恋压力 | 找对象了吗?什么时候带回来? | 2026马不停蹄,缘分马上就到。 | 借马年谐音,幽默化解。 |
| 收入财务 | 今年发了多少年终奖?工资涨了吗? | 刚够马儿吃草,主打一个充实。 | 示弱但不失志,回避数字。 |
| 房产资产 | 买房了吗?是在城里买的吗? | 还在看跑马场,得挑个草肥的。 | 借“跑马场”隐喻转移话题。 |
| 职场现状 | 工作稳不稳定?大公司还是小公司? | 龙马精神拼事业,在哪都一马当先。 | 表现上进心,模糊规模。 |
| 身体健康 | 怎么又瘦了/胖了?少熬夜。 | 收到!这就去跟周公赛马。 | 调皮回应,结束碎碎念。 |
| 社交冷场 | 大家都不说话,气氛很尴尬。 | 咱聊聊马年首场流星雨怎么样? | 主动抛出高科技话题破冰。 |
| 伪科学 | 听说吃这个对身体好,快转发。 | 科学养生龙马精神,我会留意哒。 | 不当面反驳,礼貌收尾。 |
2. 灵珠平台导入技巧
- 将上述表格保存为
social_tactics.csv。 - 登录 Rokid 灵珠 AI 平台,在“资源库”模块新建姿势库。
- 表结构配置:勾选索引,查看设置的列名,设置对应的描述与数据类型。
- 数据处理:点击确认,完成数据清洗及处理。
四、 第二步:配置智能体(Agent)的调度逻辑
知识库只是“弹药”,智能体才是“指挥官”。
1. 提示词(Prompt)设计
在智能体配置中,我们需要通过 Prompt 约束 AI 的行为,强制它只从知识库的特定字段中提取内容。
# Role: 高情商社交提词员
## Task:
实时监听环境语音,并根据【社交秘籍知识库】提供最佳话术方案。
## Output Rules (核心约束):
1. **字段提取**:当检索到相关条目时,你只需要且只能提取【高情商回复建议】这一列的内容。
2. **严禁废话**:严禁输出诸如“根据知识库建议...”或“你可以这样说...”的前缀。
3. **视觉适配**:所有输出必须精简到 15 个汉字以内,以适配 Rokid AR 眼镜的显示空间。
4. **沉默权**:如果知识库中没有相关匹配,请返回“保持从容”,不要打扰用户。
## Opening (开场白):
“主公,社交避坑系统已就位。2026 马到成功,无论亲戚出什么招,我都帮您‘马’上化解。”
五、 第三步:编排核心工作流(Workflow)
这是整篇文章的技术高地。我们要把知识库检索出来的原始数据,通过 JavaScript 脚本 转化为硬件可执行的 JSON 指令。
1. 链路设计
- 输入节点:接收语音转文字后的内容。
- 知识库节点:关联我们创建的库,配置检索 Top 1 结果。
- 脚本节点:对检索结果进行“深度脱水”。
2. 核心代码实现与逐行解析
在工作流的“脚本节点”中,我们需要编写逻辑来提取我们的“高情商回复建议”。
/**
* 社交助手 - 核心逻辑加工脚本
* 目标:精准提取【高情商回复建议】字段,并封装硬件指令
*/
async function main(inputs) {
// 1. 获取知识库检索出的原始片段
// inputs.kb_result 是知识库节点返回的原始内容,通常包含多个字段的文本拼接
const rawContent = inputs.kb_result || "";
// 2. 初始化兜底话术
let finalAdvice = "保持从容,龙马精神";
// 3. 字段匹配提取逻辑
// 讲解:灵珠知识库返回的内容通常会带有字段名。
// 我们需要通过正则匹配,专门抓取【高情商回复建议】后面的内容。
const fieldName = "高情商回复建议";
if (rawContent.includes(fieldName)) {
// 利用正则表达式,提取字段名后到行尾或下一个字段前的文字
const regex = new RegExp(`${fieldName}[::]\s*([^\n\r]+)`);
const match = rawContent.match(regex);
if (match && match[1]) {
finalAdvice = match[1].trim();
}
}
// 4. AR 视觉适配截断
// 讲解:AR眼镜的视野中心(Focus Area)非常宝贵。
// 经过实验室测试,单行 13-15 个汉字是“一瞥即知(Glanceable)”的生理极限。
if (finalAdvice.length > 15) {
finalAdvice = finalAdvice.substring(0, 13) + "..";
}
// 5. 封装 Rokid Rizon 硬件控制指令
// 讲解:我们不直接返回文本,而是返回一个 Action 指令,
// 这样在硬件端可以触发特定的半透明 UI 卡片。
const hardwareCommand = {
action: "ROKID_DISPLAY_HUD",
params: {
content: `🐎 ${finalAdvice}`,
position: "bottom_right", // 放置在右下角,避免遮挡对方的脸
theme: "glass_blur", // 磨砂玻璃效果,高端且不挡视线
duration_sec: 10 // 显示10秒,足够看完
}
};
return {
text_output: finalAdvice,
command_json: hardwareCommand
};
}
六、 效果验证
作为开发者,我们不需要实体眼镜也能验证效果。灵珠平台提供了强大的 Preview(预览)控制台。在这里,我们可以直接观察到“意图 -> 检索 -> 脚本加工 -> 指令生成”的全过程。
以下是针对春节期间四大高频尴尬场景的模拟测试:
场景一:面对“催婚”的幽默突围
- 模拟输入:用户小声对眼镜说:“七大姑八大姨又问我找对象没,烦死了。”
- 运行链路追踪:
-
- 意图识别:智能体通过语义分析,提取出“对象”、“催婚”等核心意图。
- KB 检索:在知识库中精准命中“婚恋压力”分类下的条目。
- 脚本转换:提取出“2026马不停蹄,缘分马上就到。”
- 下发 JSON 报文:
{
"command_json": {
"action": "ROKID_DISPLAY_HUD",
"params": {
"content": "我这千里马,正等伯乐牵呢。",
"position": "bottom_right",
"style": "glass_blur",
"duration_sec": 10
}
}
}
场景二:面对“攀比”的降维打击
- 模拟输入:用户输入:“隔壁王阿姨说她儿子月入五万,问我赚多少。”
- 运行链路追踪:
-
- 意图识别:智能体识别到“收入”、“攀比”等竞争性话题。
- KB 检索:命中“隐形攀比”条目,自动过滤掉对他人的评价,保留对己的策略。
- 脚本转换:提取“那是真厉害!我正带头冲锋呢。”
- 下发 JSON 报文:
{
"command_json": {
"action": "ROKID_DISPLAY_HUD",
"params": {
"content": "我这赛道好,复利增长快。",
"position": "bottom_right",
"theme": "warning_subtle",
"duration_sec": 8
}
}
}
场景四:面对“冷场”的科技破冰
- 模拟输入:用户通过侧边触摸板触发:“饭桌上都没人说话了,给个话题。”
- 运行链路追踪:
-
- 意图识别:识别到“无人说话”、“冷场”等社交环境诉求。
- KB 检索:命中“社交冷场”条目。
- 脚本转换:提取出具备科技感的破冰话题:“咱聊聊马年首场流星雨怎么样?”
- 下发 JSON 报文:
{
"command_json": {
"action": "ROKID_DISPLAY_HUD",
"params": {
"content": "咱聊聊马年首场流星雨怎么样?",
"position": "center_right",
"duration_sec": 15
}
}
}
技术总结与开发者视角解析
通过以上三个案例,我们可以总结出几个深度开发的技巧:
- 数据的“脱水”纯度: 大家注意看,不论知识库里的原始数据有多乱(可能包含场景分类、核心策略等),经过我们在第五章编写的
JavaScript脚本加工后,最终下发的content字段只有那句 15 字内的回复建议。这种“脱水”处理是 AR 应用成功的关键,因为它极大降低了用户在大脑中的二次信息处理成本。 - 指令的“语义化”下发: 作为开发者,我们在日志中看到的不是一段文字,而是一个标准的 JSON Schema。这意味着我们可以随时在
params中增加更多的控制参数,比如针对“攀比”场景(案例2)使用warning_subtle(淡黄色警告)主题,提醒用户注意应对;而针对“破冰”场景(案例4)使用center_right(视野更靠中心的位置),以方便用户阅读较长的科普话题。 - 逻辑的“闭环验证” : 只要这个 JSON 报文在灵珠预览窗口生成,就说明你的逻辑已经百分之百跑通了。 在真实眼镜上,这行字会像悬浮在现实世界中的“虚拟提词器”,只有你可见。这种“上帝视角”的从容感,正是 AI+AR 结合带给开发者的极致魅力。
通过这种“无设备验证”的方式,我们不仅极大地提升了开发效率,更保证了在马年春节这一真实社交战场上,我们的“灵马助手”能做到每一句回复都马到成功。
七、 进阶:如何优化你的社交助手?
在开发过程中,我也总结了一些让“提词器”更自然的黑科技:
- 动态位置调整:在脚本节点,我们可以根据对话的激烈程度调整
position。比如普通闲聊在右下角,如果是激烈的辩论,可以稍微向中心靠拢。 - 多轮对话记忆:在 Workflow 中开启 记忆模式, 选择变量或数据库。如果亲戚连续问了好几个问题,Agent 可以结合上下文给出更连贯的话术,而不是每次都从知识库里硬抠。
八、 总结
通过这篇征文,我想分享的不仅是一个“社交外挂”。
在 2026 马年春节,我们利用 Rokid 灵珠平台 的工程化能力,将私有的“高情商知识库”与 AR 硬件完美结合。
- 数据脱水:解决了信息过载。
- 知识库驱动:解决了 AI 幻觉和废话问题。
- 硬件联动:实现了从逻辑到指令的闭环。
马年春节,不再是社恐的战场,而是开发者的秀场。 只要你有好的场景洞察,再加上灵珠平台这套强大的工具链,每一个开发者都能创造出属于自己的“马年黑科技”。让我们“马”上分享,解锁更多新应用!