实战教程:用 Claude/GPT 配合 PPT Master,轻松生成原生可编辑 PPTX
GitHub 16.1k+ Star | v2.7.0(2026年5月最新版)
部分内容由AI生成
一、做 PPT 这件事,到底哪里痛苦?
1.1 传统路线:一个需求三个环节
一份 PPT 从想法到成稿,要经历三个环节:内容组织 → 视觉设计 → 反复修改。大部分人能快速搞定第一个,但第二个环节消耗 80% 的时间。更糟的是,第三个环节往往让你想重做——因为 AI 工具出的 PPT 根本改不动。
1.2 现有 AI PPT 工具:看起来很美,打开就崩
市面上的 AI PPT 工具走的是三条路,全都有致命缺陷:
| 技术路线 | 表面效果 | 真实缺陷 |
|---|---|---|
| 每页渲染成图片塞进 PPTX | 打开看还行 | 文字选不中、颜色改不了、放大就糊——本质是截图 |
| HTML/CSS 渲染后导出为 PPTX | 浏览器里很漂亮 | HTML 是文档流、PPT 是画布,导出布局必崩 |
| python-pptx 代码直出 | 元素可编辑 | AI 缺乏训练数据,做出来只是文字列表+方块 |
市面上大多数 AI PPT 工具解决的是"出一份看起来不错的 PPT",而不是"出一份真正能用的 PPT"。 如果你不需要修改,它们够用——但真实职场几乎没有不改就能交的 PPT。
1.3 国产工具的现状
2025–2026 年国产 AI PPT 工具(讯飞智文、WPS AI、7 牛 AI PPT 等)发展迅速,中文适配好、部分完全免费。但共同瓶颈是模板限制:AI 生成内容是在固定模板框架里"填空",如果模板里没有你想要布局,就做不出来。
1.4 PPT Master 解决的核心问题
PPT Master 走的是完全不同的第四条路。它不是浏览器里选模板填内容的 SaaS,而是一套跑在你本机 AI IDE 里的开源工作流——把 PDF、Word、Markdown、网页链接甚至微信公众号文章,变成一份原生可编辑的 PPTX 文件,每个元素在 PowerPoint 中双击即可编辑。
二、PPT Master 是什么?
PPT Master 官方将其定义为 harness(工具框架),不是完整 agent——它提供工作流和转换管线,AI 模型是"大脑"。
核心公式:PPT Master (harness) + AI 模型 (大脑) = 完整的 PPT 生成 agent
2.1 四个核心差异(怎么用、解决什么)
一、输出的是"真"PPT:通过 SVG → DrawingML 转换(详见第三章),确保 .pptx 里每个形状、文本框、渐变、阴影都是原生对象。不是"部分能改"或"转换后才能改"——是 100% 原生。
二、用多少付多少:PPT Master 免费开源(MIT 协议),只需付 AI 模型费。VS Code + Copilot 方案每份约 0.24,Claude Opus 约 10–20/月、Canva AI $13–30/月——用得越多越划算。
三、数据 100% 在本地:源文档在本地转换、SVG 在本地生成、PPTX 在本地导出。唯一外发的是你和 AI 编辑器的对话。对金融、法务、政府等有数据驻留要求的场景是决定性优势。
四、不绑定平台和模型:Claude Code、Cursor、VS Code + Copilot、Windsurf、Zed、Cline、Continue、Codebuddy 都能跑。模型方面 Claude 效果最好,但 GPT、Gemini、Kimi、MiniMax 同样可以驱动。
2.2 AI 多角色协作架构
PPT Master 将 PPT 制作拆为四个 AI 角色接力:
- 策略师——理解需求、制定大纲、确定设计规范
- 图片生成师——根据内容自动生成/搜索配图
- 执行师——逐页生成 SVG、排版布局
- 优化师——基于 CRAP 设计原则(对比、重复、对齐、亲密性)视觉微调
三、核心技术原理:SVG → DrawingML 的"编译"管线
3.1 为什么这条路走得通?
前文说了三条死路,PPT Master 的答案是利用 SVG 和 DrawingML 本质上是同一种东西——都是基于绝对坐标的二维矢量格式。一个矩形、一条路径、一个渐变、一个阴影,在 SVG 里怎么写,在 DrawingML 里就有对应写法。转换是"方言互译",不是跨语言翻译。
完整管线:
源文件 → AI 内容分析 → 多角色协作生成 SVG → svg2ooxml 转换 → 原生 PPTX
底层依赖独立的 PyPI 包 svg2ooxml,负责解析 SVG 标记,构建类型化的中间表示,然后渲染为 OOXML 的 XML 片段。
对程序员来说这就是编译器 IR 思路——LLVM 用中间表示统一各种语言前端,再转目标机器码。PPT Master 选了 SVG 作为 IR。
3.2 版本演进告诉你重点在哪
- v1.x:SVG 嵌入 PPTX,编辑前需手动右键"转换为形状"
- v2.3.0(2026 年 4 月):原生 DrawingML 导出成为默认行为——这是核心突破
- v2.6.0(2026 年 5 月):PPTX↔SVG 双向转换、SVG 可视化编辑器、网页图片搜索、语音旁白
- v2.7.0(2026 年 5 月 14 日):图表模板库、可定制动效与录制旁白、拆分模式
3.3 已知边界(缺陷)
- SVG 滤镜(filter)和复杂 mask 在 DrawingML 中没有对应实体,翻译时会丢失
- 图表是视觉形状而非 Excel 绑定对象——看起来好,但不能双击更新数据源
- 转换质量依赖 AI 生成的 SVG 质量:Claude Opus 最稳定,弱模型可能出现坐标偏差
四、环境搭建:从零到跑通第一份 PPT(怎么用)
4.1 环境依赖
必需:
| 依赖 | 版本要求 | 用途 |
|---|---|---|
| Python | 3.10+ | 核心运行环境——所有转换脚本都基于 Python |
| pip | 随 Python 自带 | 安装项目依赖 |
| AI 编辑器 | 最新版 | 作为大脑驱动 PPT 生成(Claude Code / Cursor / VS Code + Copilot / Codebuddy 四选一) |
可选(按需安装):
| 依赖 | 用途 |
|---|---|
| Git | 克隆仓库和接收后续更新(推荐) |
| Node.js 18+ | 抓取微信公众号等高防站点网页内容 |
| Pandoc | 处理 .doc / .odt / .rtf 等老旧格式文档 |
验证 Python 环境:
python3 --version # 确认 >= 3.10
pip3 --version # 确认 pip 可用
强烈建议使用虚拟环境,避免与系统其他 Python 项目产生包冲突:
python3 -m venv .venv source .venv/bin/activate # macOS/Linux # .venv\Scripts\activate # Windows
4.2 拉取项目
git clone https://github.com/hugohe3/ppt-master.git
cd ppt-master
拉取后的目录结构:
ppt-master/
├── skills/ # 核心工作流和脚本
│ └── ppt-master/
│ ├── scripts/ # 转换、导出、更新等工具脚本
│ └── SKILL.md # AI 角色定义文件(告诉 AI 怎么干活)
├── projects/ # 放你的源素材(PDF、Word、Markdown 等)
├── exports/ # 生成的 PPTX 输出目录
├── svg_output/ # SVG 源文件归档
├── templates/ # 模板文件
├── roles/ # AI 角色行为配置
└── requirements.txt # Python 依赖列表
推荐用 Git Clone 方式,后续 git pull 就能更新。如果下载 ZIP,更新时需要重新下载覆盖。
4.3 安装项目依赖
pip install -r requirements.txt
安装的核心依赖是 svg2ooxml(SVG→DrawingML 转换引擎,这是"PPT 可编辑"的关键)、Pillow(图片处理)、lxml(XML 解析)、curl_cffi(网页抓取)等。
验证安装:
python3 -c "import svg2ooxml; print('svg2ooxml OK')"
无报错即表示核心依赖安装成功。
常见问题:
- Windows 用户:如果 lxml 或 curl_cffi 编译报错,先安装 Microsoft C++ Build Tools,或用预编译 wheel:
pip install --only-binary=:all: -r requirements.txt- macOS 用户:如遇证书错误,运行
pip install --upgrade certifi- 建议用
python3 -m pip install -r requirements.txt而非裸pip,避免指向不同 Python 版本
4.4 使用入门
第一步:准备素材
将源文件放入 projects/ 目录,支持以下格式:
- PDF 文档 — 自动提取文字层级和图片
- Word 文档(.docx) — 保留标题层级和段落结构
- Markdown 文件 ⭐ — 最适合 AI 写作场景,结构最清晰
- 网页链接 — 自动抓取正文(支持微信公众号文章,内置防爬处理)
- 纯文本 — 直接在对话框中粘贴
建议在 projects/ 下按项目建子目录,避免多个项目文件混在一起。
第二步:对 AI 发指令
在 AI 编辑器的聊天面板中输入,例如:
请用 projects/report.pdf 生成一份 PPT,风格简洁商务,主色 #1a365d
或直接粘贴文案:
请根据以下内容生成一份 10 页的 PPT,风格偏商务简洁,主色调为深蓝色:
[粘贴你的文案]
也支持传网页链接:
请抓取这个链接的内容并生成 PPT:https://mp.weixin.qq.com/s/xxx
第三步:确认设计参数
AI 会先和你确认几项关键设计参数,才开始逐页生成:
- 模板风格 — 商务 / 科技 / 教育 / 创意等
- 画布尺寸 — 16:9(默认)/ 4:3 / 竖版 9:16 等
- 页数范围 — 建议 8–15 页
- 配色倾向 — 主色、辅助色
- 是否配图 — 用 AI 生图还是纯文字
这是 AI 确认你对输出有预期控制权的环节,不要跳过。
第四步:生成与导出
确认后 AI 逐页设计版面、生成 SVG,通过 svg2ooxml 转换为原生 PPTX。10 页左右的文档大约 10–20 分钟。
输出目录 exports/ 生成两个文件:
项目名.pptx— 原生可编辑版(所有元素是 DrawingML 对象,双击即改)项目名_svg.pptx— SVG 嵌入版(视觉备份,方便回退)
同时 svg_output/ 归档每一页的 SVG 源文件。如果某页排版不满意,可以让 AI 只重新生成那页的 SVG,无需从头再来。
如果在生成过程中 AI 迷失上下文(比如忘了项目背景),在对话框中输入「请先阅读 skills/ppt-master/SKILL.md」即可让 AI 重新加载角色定义。
4.5 完整工具流:AI 搜集资料 → 撰写文案 → PPT Master 输出
PPT Master 可以融入更大的 AI 工作流:
① AI 联网搜集资料(Claude/GPT 联网搜索)→
② AI 撰写结构化文案(Markdown 输出)→
③ 保存到 projects/ 目录 →
④ PPT Master 生成原生 PPTX
每个阶段用最合适的工具,最终产出的是原生可编辑的 PPTX,不存在"AI 生成的稿子改不动"的问题。
五、进阶能力(怎么用)
- 多格式输出:PPT 16:9/4:3、小红书封面 3:4、朋友圈 1:1、竖版 9:16 手机海报等
- 模板复用:
/create-template可将任意 PPTX 转为可复用模板,提取主题色、字体、母版结构 - 内置素材:229 个 SVG 模板页面、640+ 矢量图标、13 类图表模板(v2.7.0 新增结构命名图表库)
- 动画与旁白:页间切换动画、元素入场动画、TTS 语音旁白(支持声音克隆)、导出 MP4 视频
六、与主流 AI PPT 工具全面对比
| 维度 | PPT Master | Gamma | 讯飞智文/WPS AI |
|---|---|---|---|
| 产品性质 | 开源工作流,需自行配置 | SaaS,浏览器即用 | SaaS/插件,国内生态 |
| 输出可编辑性 | ✅ 100% 原生对象 | ⚠️ 导出后部分可编辑 | ⚠️ 模板填空 |
| 数据安全 | ✅ 全本地处理 | ❌ 云端 | ⚠️ 部分云端 |
| 费用 | 免费开源 + AI 模型费 | $10–20/月订阅 | 免费/¥28–150/年 |
| 生成速度 | 10–20 分钟 | 几秒 | 15 秒–8 分钟 |
| 适合人群 | 开发者、高频制作、数据敏感岗位 | 创意展示、轻量使用 | 日常办公、国内用户 |
一个值得注意的观察:国内十多篇 AI PPT 工具横评中,PPT Master 几乎从未被列入。侧面说明它的定位不是抢占 SaaS 市场,而是为特定人群提供不同的技术路径。
七、谁该用它,谁不该(缺陷)
✅ 适合
- 已经在用 Cursor / Claude Code 的开发者——配置成本几乎为零
- 每周都要做 PPT 且需要反复修改的人——一次配置,排版从 3 小时压到 30 分钟
- 有数据合规要求的岗位(金融、法务、政府)——全链路本地
- 追求开源和零平台绑定的人——MIT 协议,可商用可二次开发
❌ 不适合
- 一年只做几份 PPT 的非技术用户——Gamma 或讯飞智文在线工具更省事
- 需要多人协作的团队——没有实时共编能力
- 老板下午 3 点要的救火场景——生成需 10–20 分钟
- 习惯可视化拖拽操作的用户——所有交互通过 AI 对话完成
八、快速参考:常用命令
pip install -r requirements.txt # 安装依赖
python3 skills/ppt-master/scripts/update_repo.py # 更新项目
python3 skills/ppt-master/scripts/finalize_svg.py <项目路径> # 手动处理 SVG
python3 skills/ppt-master/scripts/svg_to_pptx.py <项目路径> # 手动导出 PPTX
九、总结
PPT Master 聚焦在一个核心矛盾上:AI 生成的 PPT 到底能不能改? 它的答案是"能"——每个形状、每段文字、每个渐变都是 PowerPoint 原生对象。这个目标决定了它的技术路线(SVG → DrawingML)、产品形态(本地开源工作流而非 SaaS)、目标用户(愿意配置环境但追求极致可控性的群体)。
它不是 Gamma 的平替——是另一条赛道上的选手。对于符合它画像的用户,这是目前唯一一个让 AI 生成"真 PPT"的成熟方案。
参考资源
- GitHub:github.com/hugohe3/ppt…
- 官方文档:github.com/hugohe3/ppt…
- FAQ:github.com/hugohe3/ppt…
- svg2ooxml:pypi.org/project/svg…