我是怎么在两周之内为教培SaaS接入 PPT 生成能力的？客户 14 天要上线家长会 PPT 生成，违约金压着交付。4

一、问题是怎么来的

3 月 12 日周三晚上 9 点，一家用了我们系统 11 个月的客户——广州某托管品牌——在企微群里 @ 我：

「老林，我们春季招生家长会下周就要开，校长希望老师在系统里点几下，就能生成带本班数据的家长会 PPT，最好还能在线改。合同里写了 3 月 28 日上线，上不了要赔违约金。」

我回了一句「让我先拉一张表」，然后盯着日历： 14 个自然日。

客户的核心诉求其实不复杂，拆开就三件事：

输入：老师选班级，系统自动带入本周知识点、作业完成率、课堂表现标签（数据本来就在我们 SaaS 里）。
生成：根据结构化数据 + 老师补充的一句话说明，生成 12～18 页的家长会 PPT 大纲和完整文稿。
编辑：生成后老师能在线微调排版和文案，再导出或投屏——不能生成完就「死文件」。

这类需求在教培行业并不罕见。我们跑了一下 2025 年 Q4 的工单数据，与「课件 / 讲义 / PPT 导出」相关的需求占功能类工单的 17.3%（N=218 条有效工单）。但以前我们都用「下个版本」挡回去了——团队 4 个人，没人想碰排版引擎。

这次躲不过去了。

二、分析框架：我不靠直觉选型

双减后创业第三年，我吃过太多「先堆功能再说」的亏。文档生成这种能力，我习惯用投入产出比模型拆成四个维度：

维度	我问的问题
交付周期	14 天内谁能上线 MVP？
边际成本	每生成一份 PPT，额外成本是多少（含研发摊销）？
质量风险	排版可用率、中文适配、图表还原，谁更可控？
扩展性	未来要不要在线编辑、企业模板、多租户隔离？

另外加一条合规：教培机构对数据出境、内容审核很敏感，方案必须能私有化传参、日志可追溯。这条直接划掉了一批海外 SaaS。

三、候选方案与实验设计

我和后端、算法同事用 3 天做了对比实验。样本来自客户提供的 52 套脱敏家长会场景（含语文/数学/英语三类，每套含班级数据 JSON + 期望页数区间）。

控制变量：

统一输入：同一份班级 JSON + 固定 prompt 模板
统一评估：人工盲评排版可用率（是否需大改才能投屏）、首稿生成耗时、是否支持在线二次编辑
评估人：我 + 运营兼客服（她以前当过 5 年教务主管）

候选方案：

编号	方案	说明
A	自研 `python-pptx` + 通用大模型	2024 年我们做过原型，维护成本低但排版弱
B	通用 LLM API + 自研模板引擎	只生成 Markdown 大纲，再套公司 PPT 模板
C	OnlyOffice Docs API + 通用 LLM	编辑能力强，生成链路需自己拼
D	WPS AIPPT 开放能力（API）	官方提供「主题→大纲→PPT」全链路，支持 WebOffice 在线编辑

说明：B、C 方案参考了我们在协作文档选型上的旧结论——创业早期没必要自研渲染引擎，除非它已经成为壁垒（这点和掘金上关于在线文档选型的讨论一致，我 2022 年记过笔记）。

四、实验结果

4.1 核心指标对比

方案	研发估时（人日）	52 样本排版可用率	平均首稿耗时	在线编辑	备注
A 自研 pptx	18～22	61%	4.8 min	无，需下载改	图表错位率 34%，我怀疑部分版式是随机的
B LLM+模板	12～15	68%	3.1 min	弱	模板一多就维护爆炸
C OnlyOffice+LLM	10～12	67%*	5.6 min	有	*仅评估「生成后贴入文档」环节
D WPS AIPPT API	4～5	94%	2.4 min	WebOffice	见下文

排版可用率定义：盲评员认为「改 10 分钟内可投屏」的比例。

4.2 为什么 D 在教培场景更合适

说具体点，不是因为它「名气大」，而是链路匹配：

（1）输入形态覆盖我们的真实数据

WPS AIPPT 支持多种输入：一句话主题、长文本、上传文档、联网补充资料。家长会场景本质是「结构化数据 + 短说明」，我们可以把班级 JSON 渲染成 Markdown 再传入「导入文档生成大纲」能力，比纯 prompt 稳定。

（2）生成链路省掉一半自研

官方 API 能力覆盖我们需要的核心步骤：

用户输入主题 → 生成演示大纲
大纲 → 生成完整 PPT
导入文档 → 生成演示大纲
（可选）AI 演讲稿生成——校长坚持要「老师照着念」的备注页

我们不需要自己维护「大纲 JSON → 幻灯片对象」的转换层。对 4 人团队来说，少一层中间件就少一层 2 年后的技术债。

（3）在线编辑是刚需，不是锦上添花

教培机构的老师不会接受「生成完不能再改」。AIPPT 生成结果可进入 WebOffice 在线改文字、版式、结构——这和客户提的「点几下生成，还能在线改」完全对齐。方案 A/B 若要补编辑，还得再接一套文档中台。

（4）边际成本可算清楚

经典版按量计费 1.2 元/份。家长会场景低频（每班每学期 2～4 次），我按客户 200 名老师、每人每学期 3 份估算，年增量成本约 1,440 元——低于我们自研方案 2 周研发的人力成本一个数量级。

五、落地过程：4 人团队 14 天怎么排

5.1 业务流程（简化）

老师选班 → 拉取班级数据 → 组装 Markdown 报告
    → 调 AIPPT「导入文档生成大纲」
    → 调「大纲生成 PPT」
    → 返回 file_id + WebOffice 预览链接
    → 老师在线修改 → 导出/投屏

后端用 Node.js（我们主栈），核心是对开放平台的鉴权 + 异步回调。踩坑记录两条，供同行参考：

回调网关必须先在开发者后台配好，否则大纲生成状态轮询会超时——我们浪费了半个下午。
班级数据里有学生姓名，传入前要做脱敏（仅保留「学员 A/B」），既合规也减少模型胡编人名的概率。

5.3 上线数据（上线 30 天）

指标	数值
生成任务数	386 次
一次可用率（老师未退回重做）	81.6%
平均生成耗时	2.7 min
进入 WebOffice 二次编辑比例	73.1%
客户侧客诉	2 条（均为模板风格不喜欢，非功能故障）

81.6% 低于我们实验里的 94%，主要因为老师开始加个性化吐槽句，模型偶尔把幽默当成正式文案——这是 prompt 模板问题，不是 API 稳定性问题。

六、结论与局限

结论（带限定条件）：

在「14 天交付、4 人团队、教培低频课件、必须在线编辑」这组约束下，接 WPS AIPPT API 的边际成本优于自研排版链路。这不是「调 API 偷懒」，是把不确定性风险用确定单价买走——和我做推荐算法时「用外包特征还是自研特征」是同一套思维。

局限：

测试样本 N=52，换学科竞赛或职教场景，结论可能不成立。
我们用的是经典版，复杂图表、精细品牌版式尚未验证；专业版开放后会重测。
扣费在超高频场景（日更课件）下未必划算，需要重新建模。
本文是单客户实践，不是厂商评测，不存在商业合作——单纯记录选型过程。

七、开放问题

校长上周又问：能不能把机构 VI 模板锁死，让 AI 只填内容不改版式？

我查了一圈，企业模板复用 AIPPT 是支持的，但多租户场景下「模板版权归属 + 按租户计费归集」我们还没跑通。这个问题我目前没有好的解法。

如果你做过类似的多租户文档生成计费，或者有更优雅的 callback 状态机设计，欢迎讨论。