一、问题是怎么来的
3 月 12 日周三晚上 9 点,一家用了我们系统 11 个月的客户——广州某托管品牌——在企微群里 @ 我:
「老林,我们春季招生家长会下周就要开,校长希望老师在系统里点几下,就能生成带本班数据的家长会 PPT,最好还能在线改。合同里写了 3 月 28 日上线,上不了要赔违约金。」
我回了一句「让我先拉一张表」,然后盯着日历: 14 个自然日。
客户的核心诉求其实不复杂,拆开就三件事:
- 输入:老师选班级,系统自动带入本周知识点、作业完成率、课堂表现标签(数据本来就在我们 SaaS 里)。
- 生成:根据结构化数据 + 老师补充的一句话说明,生成 12~18 页的家长会 PPT 大纲和完整文稿。
- 编辑:生成后老师能在线微调排版和文案,再导出或投屏——不能生成完就「死文件」。
这类需求在教培行业并不罕见。我们跑了一下 2025 年 Q4 的工单数据,与「课件 / 讲义 / PPT 导出」相关的需求占功能类工单的 17.3%(N=218 条有效工单)。但以前我们都用「下个版本」挡回去了——团队 4 个人,没人想碰排版引擎。
这次躲不过去了。
二、分析框架:我不靠直觉选型
双减后创业第三年,我吃过太多「先堆功能再说」的亏。文档生成这种能力,我习惯用投入产出比模型拆成四个维度:
| 维度 | 我问的问题 |
|---|---|
| 交付周期 | 14 天内谁能上线 MVP? |
| 边际成本 | 每生成一份 PPT,额外成本是多少(含研发摊销)? |
| 质量风险 | 排版可用率、中文适配、图表还原,谁更可控? |
| 扩展性 | 未来要不要在线编辑、企业模板、多租户隔离? |
另外加一条合规:教培机构对数据出境、内容审核很敏感,方案必须能私有化传参、日志可追溯。这条直接划掉了一批海外 SaaS。
三、候选方案与实验设计
我和后端、算法同事用 3 天做了对比实验。样本来自客户提供的 52 套脱敏家长会场景(含语文/数学/英语三类,每套含班级数据 JSON + 期望页数区间)。
控制变量:
- 统一输入:同一份班级 JSON + 固定 prompt 模板
- 统一评估:人工盲评排版可用率(是否需大改才能投屏)、首稿生成耗时、是否支持在线二次编辑
- 评估人:我 + 运营兼客服(她以前当过 5 年教务主管)
候选方案:
| 编号 | 方案 | 说明 |
|---|---|---|
| A | 自研 python-pptx + 通用大模型 | 2024 年我们做过原型,维护成本低但排版弱 |
| B | 通用 LLM API + 自研模板引擎 | 只生成 Markdown 大纲,再套公司 PPT 模板 |
| C | OnlyOffice Docs API + 通用 LLM | 编辑能力强,生成链路需自己拼 |
| D | WPS AIPPT 开放能力(API) | 官方提供「主题→大纲→PPT」全链路,支持 WebOffice 在线编辑 |
说明:B、C 方案参考了我们在协作文档选型上的旧结论——创业早期没必要自研渲染引擎,除非它已经成为壁垒(这点和掘金上关于在线文档选型的讨论一致,我 2022 年记过笔记)。
四、实验结果
4.1 核心指标对比
| 方案 | 研发估时(人日) | 52 样本排版可用率 | 平均首稿耗时 | 在线编辑 | 备注 |
|---|---|---|---|---|---|
| A 自研 pptx | 18~22 | 61% | 4.8 min | 无,需下载改 | 图表错位率 34%,我怀疑部分版式是随机的 |
| B LLM+模板 | 12~15 | 68% | 3.1 min | 弱 | 模板一多就维护爆炸 |
| C OnlyOffice+LLM | 10~12 | 67%* | 5.6 min | 有 | *仅评估「生成后贴入文档」环节 |
| D WPS AIPPT API | 4~5 | 94% | 2.4 min | WebOffice | 见下文 |
排版可用率定义:盲评员认为「改 10 分钟内可投屏」的比例。
4.2 为什么 D 在教培场景更合适
说具体点,不是因为它「名气大」,而是链路匹配:
(1)输入形态覆盖我们的真实数据
WPS AIPPT 支持多种输入:一句话主题、长文本、上传文档、联网补充资料。家长会场景本质是「结构化数据 + 短说明」,我们可以把班级 JSON 渲染成 Markdown 再传入「导入文档生成大纲」能力,比纯 prompt 稳定。
(2)生成链路省掉一半自研
官方 API 能力覆盖我们需要的核心步骤:
- 用户输入主题 → 生成演示大纲
- 大纲 → 生成完整 PPT
- 导入文档 → 生成演示大纲
- (可选)AI 演讲稿生成——校长坚持要「老师照着念」的备注页
我们不需要自己维护「大纲 JSON → 幻灯片对象」的转换层。对 4 人团队来说,少一层中间件就少一层 2 年后的技术债。
(3)在线编辑是刚需,不是锦上添花
教培机构的老师不会接受「生成完不能再改」。AIPPT 生成结果可进入 WebOffice 在线改文字、版式、结构——这和客户提的「点几下生成,还能在线改」完全对齐。方案 A/B 若要补编辑,还得再接一套文档中台。
(4)边际成本可算清楚
经典版按量计费 1.2 元/份。家长会场景低频(每班每学期 2~4 次),我按客户 200 名老师、每人每学期 3 份估算,年增量成本约 1,440 元——低于我们自研方案 2 周研发的人力成本一个数量级。
五、落地过程:4 人团队 14 天怎么排
5.1 业务流程(简化)
老师选班 → 拉取班级数据 → 组装 Markdown 报告
→ 调 AIPPT「导入文档生成大纲」
→ 调「大纲生成 PPT」
→ 返回 file_id + WebOffice 预览链接
→ 老师在线修改 → 导出/投屏
后端用 Node.js(我们主栈),核心是对开放平台的鉴权 + 异步回调。踩坑记录两条,供同行参考:
- 回调网关必须先在开发者后台配好,否则大纲生成状态轮询会超时——我们浪费了半个下午。
- 班级数据里有学生姓名,传入前要做 脱敏(仅保留「学员 A/B」),既合规也减少模型胡编人名的概率。
5.3 上线数据(上线 30 天)
| 指标 | 数值 |
|---|---|
| 生成任务数 | 386 次 |
| 一次可用率(老师未退回重做) | 81.6% |
| 平均生成耗时 | 2.7 min |
| 进入 WebOffice 二次编辑比例 | 73.1% |
| 客户侧客诉 | 2 条(均为模板风格不喜欢,非功能故障) |
81.6% 低于我们实验里的 94%,主要因为老师开始加个性化吐槽句,模型偶尔把幽默当成正式文案——这是 prompt 模板问题,不是 API 稳定性问题。
六、结论与局限
结论(带限定条件):
在「14 天交付、4 人团队、教培低频课件、必须在线编辑」这组约束下,接 WPS AIPPT API 的边际成本优于自研排版链路。这不是「调 API 偷懒」,是把不确定性风险用确定单价买走——和我做推荐算法时「用外包特征还是自研特征」是同一套思维。
局限:
- 测试样本 N=52,换学科竞赛或职教场景,结论可能不成立。
- 我们用的是经典版,复杂图表、精细品牌版式尚未验证;专业版开放后会重测。
- 扣费在超高频场景(日更课件)下未必划算,需要重新建模。
- 本文是单客户实践,不是厂商评测,不存在商业合作——单纯记录选型过程。
七、开放问题
校长上周又问:能不能把机构 VI 模板锁死,让 AI 只填内容不改版式?
我查了一圈,企业模板复用 AIPPT 是支持的,但多租户场景下「模板版权归属 + 按租户计费归集」我们还没跑通。这个问题我目前没有好的解法。
如果你做过类似的多租户文档生成计费,或者有更优雅的 callback 状态机设计,欢迎讨论。