10 年设计经验压进一个 Skill:归藏大佬的 PPT 工具为什么火了

0 阅读8分钟

Hello,我是Niko。16年程序员老兵,专注分享 AI编程实战经验、宝藏工具资源、前沿技术动态。不玩套路,多讲干货。


前两天看到归藏大佬开源了一个做 PPT 的 Claude Code Skill,叫 guizang-ppt-skill。我装上跑了一遍,被打动了。

打动我的有两点。

第一是放出的效果图。配色克制、字体有讲究,整体风格很有品味。不像 AI 做的,倒像有个审美在线的设计师做了一套杂志风幻灯片。

第二是生成流程的设计。它会通过反向提问弄清你真正的需求,再通过中间产物保证最后成品不偏离。

下面展开聊这两件事。如果你也在做自己的 Skill,它们比功能列表重要得多。

它是什么

说白了:你跟 Claude 说"帮我做一份杂志风 PPT",它给你一个单文件 HTML。双击在浏览器里翻页放映,键盘左右、滚轮、触屏都能控制,按 ESC 出缩略图索引。

整体定位归藏大佬自己的话叫"电子杂志 × 电子墨水"。封面墨色底加衬线大字,配 WebGL 流体动效;正文纸白底配墨字。横向翻页,每一页都能拿出来当海报。

技术栈很克制。没有 React,没有打包工具,没有运行时依赖。一个 HTML 文件,CSS、WebGL 背景、翻页 JS 全打在里面。换主题色就是改 6 行 CSS 变量。

仓库结构也简单:

guizang-ppt-skill/
├── SKILL.md              # 工作流、原则、常见错误
├── assets/template.html  # 完整可运行的种子模板
└── references/
    ├── components.md     # 组件手册
    ├── layouts.md        # 10 种页面布局骨架
    ├── themes.md         # 5 套主题色预设
    └── checklist.md      # 质量检查清单(P0/P1/P2/P3 分级)

10 种页面布局、5 套主题色,看上去选项不少。但大佬在 SKILL.md 里写了一句话我特别认同:约束越严,风格越稳。所以主题色不允许自定义 hex,只能从 5 套里挑;布局也只能从 10 种骨架里粘。这种"故意不给你自由"的克制,才是品味落地的关键。

第一条线:品味是怎么"压进去"的

做 PPT 的 Skill 很多,但大部分视觉产出都是那种"AI 味儿"很重的东西。渐变色块、阴影卡片、没有呼吸感的版面。大佬这个 Skill 做出了不一样的品味,我觉得靠的是三层约束。

ChatGPT Image 2026年4月25日 22_47_11.png

字体三级分工,每一级有明确职责。 衬线字体只用在观点和标题,大而重,撑起视觉重心;非衬线字体负责正文信息,干净可读;等宽字体处理元数据和标注。三种字体各司其职,不混用。很多 PPT 的"高级感"其实就是"不乱用字体"。

色彩纪律,比技巧重要。 五套主题色都遵循同一个原则:纸白 + 墨色 + 一个重点色。底色没有一个是 #FFFFFF,字色没有一个是 #000000。归藏大佬用的词叫"色彩纪律",不是教你配色的技巧,而是用规则把翻车的可能性堵死。

网格节奏,强制交替。 7:5、6:6、8:4 三种固定分栏,hero 页(深色大字报)和 non-hero 页(浅色内容页)必须交替出现。这一条直接决定了翻完整套 PPT 的阅读体验,深浅交替带来的节奏感,让人不累眼睛。

这三层加在一起,AI 生成内容的时候就只能在约束范围里活动。它没机会做出"红配绿"的封面,也没机会连排五页密密麻麻的文字页。品味不是靠 prompt 告诉 AI"要好看",是靠规则把"不好看"的路全堵上。

第二条线:流程设计才是 Skill 的核心竞争力

品味让效果好看,流程设计决定这个 Skill 用起来稳不稳。大佬的 PPT Skill 有一套我觉得值得很多 Skill 作者学习的流程:先问清楚需求,再用中间产物做校准,最后才动手生成。

先问,再做

你说完"帮我做一份 PPT"之后,Claude 不会直接开始写代码。它会主动问你几个关键问题:

002.png

  • 这个 PPT 的受众和场景是什么?
  • 预计分享时长多久?(决定页数)
  • 你有没有原始素材?(功能列表、截图、数据)
  • 选哪套主题色?

我试的时候说"做一个 GPT-IMAGE-2 发布新功能介绍的 PPT",它问了四个问题,我选了"社交媒体传播""5-10 分钟(8-10 页)""没有素材帮我搭""墨水经典"。整个对齐过程不到一分钟。

这个设计解决的问题很实际:多数 Skill 是"你说一句我就干",结果做出来和你想的不一样,改来改去比从头做还浪费时间。先花一分钟问清楚,后面不走弯路。

中间产物:大纲先行

问完之后,Skill 不会直接开始生成 HTML,而是先输出一份内容大纲。我实测拿到的是一张 9 页的规划表:

003.png

注意最后一行的备注:节奏 dark → light → hero light → light → dark → light → hero dark → light,满足所有硬规则。

这张表就是"中间产物"。你看完觉得页数不对、顺序不对、某个页面方向不对,可以在这一步就调整,不用等 HTML 都生成完了再返工。

道理很朴素:让人在成本最低的阶段做修改。 改一行大纲比改一页 HTML 便宜得多。

生成之后还能改

最终产物出来后,Skill 会给一份总结,列出每页的内容概览和主题类型,并明确告诉你下一步可以做什么:

006.png

这一步看起来简单,但很关键。它传递了一个信号:产物不是终态,你可以继续迭代。 很多 Skill 做完就结束了,用户要改就得重来。他的 Skill 保持了对话的延续性,改图、改顺序、改文案,都能在当前上下文里继续操作。

实测效果:GPT-IMAGE-2 新功能发布 PPT

说再多不如看实物。我用这个 Skill 做了一份 GPT-IMAGE-2 新功能发布的 PPT,主题色选墨水经典(默认),内容让 Claude 自己搭。

004.png 核心参数那一页做出来的效果让我比较惊喜。4K、3秒、99%、50+、5.4、Hi-Fi 六个大数字铺满页面,衬线字体放到很大,下面用小号非衬线字体做标注。信息密度高但不拥挤,数字的视觉冲击力很强。

005.png

对比页处理得也很干净。左边 DALL-E 3 用"扩散模型 · 单次生成"做标题,右边 GPT-IMAGE-2 用"推理驱动 · 理解式生成",下面各列 5-6 个特性对比。深色背景把两列内容压住,一眼能扫出差异。

从给完需求到 HTML 文件生成,整个过程大概 3 分钟。产出的是一个单文件 HTML,双击就能在浏览器里看。不需要安装任何东西,也不依赖任何外部字体或动画库。

快速上手

两种安装方式:

# 方式一:npx 一键安装
npx skills add https://github.com/op7418/guizang-ppt-skill --skill guizang-ppt-skill

# 方式二:手动 clone
git clone https://github.com/op7418/guizang-ppt-skill.git ~/.claude/skills/guizang-ppt-skill

装完对 Claude 说"帮我做一份杂志风 PPT"就能触发。回答完几个澄清问题就开始生成。

图片放在 images/ 目录下,用"页号补零 + 英文语义"命名(比如 01-cover.jpg)。换图的时候同名覆盖就行,HTML 不用动。

不足和提醒

说几个我用的过程中注意到的点。

单文件 HTML 的局限。 所有东西都打在一个文件里,图片多、分辨率高的话,文件体积会比较大。适合演讲场景在线放映,不太适合发邮件附件。

只有 5 套主题色。 不能自定义颜色是它刻意的设计决策。但如果你的品牌色不在这 5 套里,只能手动改 CSS 变量。对非开发者来说有门槛。

适用场景有边界。 大佬在 README 里写得很坦诚:它适合线下分享、私享会、demo day 这类偏个人风格的场景。大段表格数据、培训课件这类信息密度高的需求,不是它的菜。

对 Claude 版本有要求。 它是 Claude Code Skill,需要在 Claude Code 环境里用。如果你还没开始用 Claude Code,需要先安装配置。

给 Skill 作者的启发

最后多说两句。这个 Skill 让我想到很多人做 Skill 容易踩的坑:花大量时间堆功能,却忽略了品味和流程。

归藏大佬做对的两件事很值得记住。

ChatGPT Image 2026年4月25日 16_12_03.png

第一,用约束代替自由。 不让用户自定义颜色、不提供无限布局选项、不让 AI 自由发挥排版。听起来反直觉,但"约束越严,风格越稳"这句话在 AI 生成场景下尤其正确。AI 需要的不是更大的自由度,是更明确的边界。

第二,用流程代替运气。 不是一句 prompt 直接出结果然后听天由命,而是先问清需求、先出大纲、再生成、还能迭代。每一步都有中间产物可以校准。这套流程让"做出来不对"的概率大幅下降。

如果你也在做自己的 Skill,不妨去翻翻他的 SKILL.md 和 references 目录。比代码本身更有价值的,是他怎么想这件事的。


Niko-白色版.png

参考资料: