原创 Hybrid AI Hub
这篇文章写给谁? 经常要做 PPT、但不想从零搭的人;想用 AI 帮自己做 PPT、但被"全是图片不能编辑"搞烦过的人。
说实话,现在 AI 做 PPT 的工具一大堆。但你拿到之后才发现——每一页都是一张图,字体不对想改一个词都改不了,还要重新生成。
PPT Master做的事情只有一件:给你一份每个元素都能点开直接改的真 PowerPoint,不是图片拼的。
它到底能做什么?先看效果
下面这个动图,是把一篇微信公众号文章直接丢给 PPT Master,端到端生成 12 页 PPT 的完整效果:
每一个形状、每一个文本框,都是真正可以在 PowerPoint 里点击编辑的——不是导出的截图。
这是不同风格的效果展示:
▲ 六种内置风格循环展示:杂志风、学术风、暗色艺术风、自然纪录风、科技 SaaS 风、发布会风
跑起来需要什么?
先说结论:只需要装 Python,其他都是一行命令搞定。
PPT Master 本质上是一套运行在 AI IDE 里的工作流(作者叫它"harness")。你在 IDE 的聊天框里跟 AI 说「用这份 PDF 做一份 PPT」,AI 就按这套流程在你电脑上生成 .pptx——你不需要写任何代码。
工具准备清单:
- Python 3.10+(必须,唯一真正要装的东西)
- 一个 AI IDE,比如 Cursor、VS Code + Claude Code** 插件、Windsurf 等
- Claude API Key 或其他大模型 API Key(GPT、Gemini、Kimi 等均可)
这里要提醒一下:官方推荐用 Claude Sonnet / Opus 级别的高性能模型搭配使用。用基础模型能跑,但最终输出质量差别会比较明显。
macOS / Linux 环境准备:
macOS
brew install python
git clone github.com/hugohe3/ppt…
cd ppt-master
pip install -r requirements.txt
Windows 用户:
安装时有一个细节——在 python.org 下载安装包,记得勾上 「Add Python to PATH」,不然后面所有命令都会报错。之后在项目目录下执行:
pip install -r requirements.txt
装完就可以开始了,Pandoc** 等附加依赖只有处理 .doc、.rtf、.tex 等小众格式时才用到,普通用户基本不需要。
一步步:从原始文件到 PPT
第一步:把项目下载下来
不用 Git 也没关系,直接去 GitHub 页面点 Code → Download ZIP,解压即用。
用 Git 的话:
git clone github.com/hugohe3/ppt…
cd ppt-master
pip install -r requirements.txt
国内网速慢可以换 AtomGit 镜像源:
git clone atomgit.com/hugohe3/ppt…
第二步:选一个 AI IDE
推荐新手用 Cursor(安装后开箱即用,界面直观)。有 Claude Code 使用经验的可以直接用 Claude Code CLI。
打开 IDE 之后,把 ppt-master 目录作为工作区打开。
第三步:把你的材料放进 projects/ 目录
支持的格式非常全:PDF、DOCX、图片、网址链接、Markdown 文本,甚至直接在聊天框粘文字也行。
建议在 projects/ 下新建一个子目录,比如 projects/my-report/sources/,把素材丢进去。
第四步:在聊天框里描述需求
打开 IDE 的 AI 聊天面板,直接说:
请用 projects/my-report/sources/report.pdf 这份文件生成一份 PPT
AI 会先跟你确认设计规范,比如模板风格、页数、格式(16:9 还是其他)。确认之后它就开始全自动处理——内容分析、视觉设计、SVG 生成、PPTX 导出,全程不需要你干预。
最终输出的文件在 exports/ 目录下,直接用 PowerPoint 打开就能编辑。
几个让效果更好的用法
配图怎么处理?
PPT 里用到的图片有两条路:
- AI 生图: 配置好模型 API Key(支持多家主流图像生成模型),在
.env文件里设置IMAGE_BACKEND,生成质量最稳定 - 网络搜图: 零配置就能用,但图片质量参差不齐。推荐额外申请免费的 Pexels API Key 或 Pixabay API Key,图片质量会好很多
.env 文件从 .env.example 复制一份改就行:
cp .env.example .env
想复刻自己喜欢的模板风格?
这是 PPT Master 里很实用但容易被忽略的功能。
把任何一份你喜欢的 .pptx 丢给 AI,说一句「用 /create-template 复刻成模板」,它会把这份 PPT 的主题色、字体、母版结构、图片全部提取出来,变成一套可以直接被 PPT Master 调用的私人模板。
公司的品牌 Deck、客户中标用的模板、网上找的高质量参考稿——都能一键变成自己的模板库,从此不受内置风格限制。
加动画和旁白?
PPT Master 还支持:
- 页间转场 + 页内元素入场动画: 输出真正的 OOXML 动画,在 PowerPoint 和 Keynote 里原生播放,不是嵌入视频
- 语音旁白: 按页生成 TTS 旁白(支持 90+ 种语言),嵌回 PPTX,再用 PowerPoint 自带「导出视频」就能出带旁白的 MP4,全程不需要第三方工具
- 声音复刻: 用 ElevenLabs / MiniMax / Qwen / CosyVoice 复刻出自己的声音,让 PPT 用「你的声音」念出来
常见问题
Q:AI 生成到一半「迷失」了,不知道下一步怎么做?
让它先读一下 skills/ppt-master/SKILL.md,相当于给它重新对齐工作流程说明书。
Q:用其他模型可以吗,不一定要 Claude?
可以。Cursor、VS Code Copilot、Aider、Claude Code 等 AI IDE 都可以驱动;Claude、GPT、Gemini、Kimi 等主流模型基本都能用。但官方明确说明:Claude Sonnet / Opus 这类大上下文高质量模型是质量上限最高的选择,基础模型能跑流程,但细节设计质量差距比较明显。
Q:数据安全吗?文件会上传到哪里?
除了跟 AI 模型的对话,整个生成流程在本地完成,你的原始文件不会被上传到任何第三方服务器。
总结一下
PPT Master 的定位很清晰:
- 输入什么都行(PDF、DOCX、网址、纯文字)
- 输出的是真正可编辑的 PowerPoint,不是图片拼的壳
- 工具本身完全免费开源,唯一成本是 AI 模型的调用费用
- 数据不出本地,模型不锁定任何一家
对于经常要做汇报、提案、研究展示的人来说,这套工具能把「从材料到 PPT」这段最耗时间的路程压缩得很短。
项目地址:github.com/hugohe3/ppt-master
我的API:portal.hai.network/?utm_source…