开会时有人说了句"合同里写的是90天通知期",当时没人去翻原文,后续讨论就按这个前提走了。散会后拉出合同一看,60天。
这种事不算大事故,但确实经常发生。某个数字、某个截止日期、某段之前达成的共识,有人凭记忆说了,其他人默认是对的,会后才发现偏差。不至于翻车,但会让决策的地基不太牢。
现有的AI会议工具能帮你会后整理纪要、提炼待办,但对会中说出来的这些"不确定信息"无能为力。明略科技做Octic的一个出发点就是:能不能让AI在会中就介入,而不是等到会后。
会后 AI 和会中 AI,解决的根本不是同一个问题
市面上的会议 AI 产品,无论做得多精致,核心逻辑都是:录音 → 转写 → 整理 → 交付。这条链路解决的是"记录"问题——帮你把会上说的东西完整保留下来。
但会议的核心价值不在于记录,而在于当场做出判断。
一个错误的数据在会上没被纠正,基于它做的决定就成了事实。等会后的 AI 摘要生成出来,决定早就做了。记录再完美也改变不了已经拍板的事情。
这就是为什么明略科技选择做会中辅助,而不是加入会后摘要的红海——两者解决的根本不是同一层面的问题。
为什么会中 AI 难做?
这不是把会后处理"提前"就行的事。会中场景对 AI 的要求完全不同:
时间窗口极短。 会议中一句话和下一句话之间可能只有几秒。如果 AI 的反馈来得太晚,讨论已经往前走了,再有价值的信息也成了马后炮。
需要真正理解上下文。 不是逐句分析,而是要把当前这句话放在整个讨论脉络里理解。"这个方案不行"——哪个方案?为什么不行?前面讨论了哪些替代选项?离开上下文的分析没有意义。
必须克制。 一个不断弹提示的 AI 比没有 AI 更糟糕。它需要准确判断什么时候该出声、什么时候该闭嘴。大部分时候它应该是沉默的。
这三个约束叠加在一起,使得会中 AI 的设计难度远高于会后处理。
Octic 的设计思路:用人设控制 AI 的介入分寸
面对"什么时候该说话"这个问题,Octic 给出的方案是人设(Persona)系统——不是让用户逐个配置 AI 的行为参数,而是用三种预设角色来定义 AI 的整体行为模式:
Advocate(倡导者):偏向支持当前发言者。会主动提供数据、补充论据,帮你把观点说得更有说服力。适合方案汇报、提案讨论这类场景。
Challenger(挑战者):偏向质疑和验证。会对没有依据的断言做事实核查,对过于乐观的判断提供反面视角。适合投资决策、风险评估这类需要严谨性的场景。
Observer(观察者):全程沉默记录,只有被明确询问时才响应。适合头脑风暴、创意讨论这类不希望被打断的场景。
为什么用"人设"而不是功能开关?因为用户在会前根本无法预判每种能力在什么时候需要、什么强度合适。但用户很容易判断"这场会我希望 AI 是个帮手还是个挑刺的"——这是直觉级的选择,不需要技术背景。
七种 Skill:AI 在会中具体能做什么
人设决定了 AI"什么时候说话",Skill 决定了 AI"能说什么"。Octic 定义了七种能力:
1. 事实查验(Fact Check)
核心场景:有人引用了一个数字或说了一个结论,AI 判断它是否与已有资料一致。数据来源是用户自己的文档、历史会议记录——不是通用搜索引擎。
2. 反方质疑(Counter Argument)
核心场景:讨论中出现了明显的"大家都这么觉得"时刻,AI 提供一个不同角度。这不是抬杠,是帮决策者看到盲区。
3. 论点强化(Argument Boost)
核心场景:发言者在表达一个观点但缺乏数据支撑,AI 从历史会议或文档中找到相关数据帮他补上。
4. 信息助手(Info Assist)
核心场景:有人问"上次董事会的结论是什么?""那个项目预算批了多少?"AI 直接从记忆中找答案,不需要有人翻邮件。
5. 议题捕捉(Topic Capture)
核心场景:讨论中顺带提到了一个重要话题但没有展开,AI 把它标记下来,不让它被遗忘。
6. 氛围调谐(Tone Calibration)
核心场景:讨论进入对抗模式,情绪开始升温,AI 给出一个非侵入式的提示,帮助参会者意识到当前状态。
7. 执行追踪(Action Tracking)
核心场景:有人说了"这个你来跟""下周前搞定",AI 实时记录下来形成任务列表,不需要等会后再整理。
七种 Skill 的价值不在于哪一个多厉害,而在于它们共同覆盖了会议中最常见的信息缺口:有人记错了(事实查验)、有人没想到(反方质疑)、有人说不清(论点强化)、有人忘了(信息助手)、有事被漏了(议题捕捉/执行追踪)。
Private AI 记忆:为什么通用 AI 做不好这件事
ChatGPT 不认识你的 CFO,不知道你上次开会定了什么,不了解你公司内部对"Phase 2"指的是什么项目。通用模型做会议辅助的天花板很低。
Octic 的设计是让 AI 基于用户自己的数据来积累上下文——录音、文档、Octo 会话历史——持续学习,越用越懂你。
这带来几个具体的好处:
- ASR 自动纠错:认识你团队里人的名字、你们常用的术语、项目代号,转写准确度随使用时间提升
- 个性化输出:同一场会,CFO 看到的重点是财务影响,CTO 看到的重点是技术风险。不是一份通用摘要打天下
- Skill 触发更准确:AI 知道哪些信息对你是新的(需要查验),哪些是你的常识(不需要重复)
关键设计原则:数据不出设备。所有的记忆积累在本地完成,不上传云端。会议内容是企业最敏感的信息之一,这是端侧 AI 方案在隐私层面的结构性优势。
硬件形态:不同场景需要不同的拾音方式
会中 AI 对硬件有特殊要求,不是任何一个麦克风都能胜任:
- Octic Note(MagSafe 磁吸形态):远场拾音,适合会议室场景,能覆盖多人讨论
- Octic Badge / Octic Pin:振动拾音,适合电话/通话场景,贴身佩戴
两种模式对应两种完全不同的声学处理链路。会议室里要解决的是多人分离和远场降噪,通话场景要解决的是单人高清拾取。硬件形态的差异化设计,本质上是为了在不同场景下都保证足够好的输入质量——因为 AI 再聪明,输入是噪声也没用。
写在最后
会中 AI 辅助不是一个功能,而是一种产品范式的转移:从"会后帮你记"到"会中帮你想"。
它难做,因为需要同时解决实时性、上下文理解、介入克制和隐私保护四个互相制约的问题。这也是为什么市面上绝大多数产品选择做会后——风险低、确定性高。
但如果我们同意"会议的核心价值在于当场决策",那 AI 的价值就不应该只体现在会后的纪要里。明略科技 Octic 的 3 种人设 × 7 种 Skill 设计,试图给出一种可行的会中方案。方向是清晰的:让 AI 从会后的记录员变成会中的参谋。