我做了一个 AI Skill,丢文档就出中文手绘技术配图
支持 Markdown、飞书文档、PPTX、PDF,一条命令安装,三条路径适配不同 AI 编程工具
痛点
写技术文章最头疼的不是写字,是配图。
- PPT 模板千篇一律,一眼就看出来"又是 Canva"
- 找设计师画一张配图,来回改三次,比写文章还慢
- AI 画图工具是有了,但每次都要从零写 prompt,出来的风格不统一
- 飞书里写了一大篇文档,想出几张配图,还得先导出再粘贴
我想要的很简单:把文档丢进去,直接出一组风格统一的中文手绘配图。
doc-to-sketch 是什么
doc-to-sketch 是一个 AI Skill(可以理解为给 AI 编程助手装的"插件"),专门把文档内容转换成中文手绘技术解释图。
一句话描述:文档进,手绘图出。
风格长这样:
视觉特征:近白纸底、无边框、细手绘线条、淡色标记、中央小图、大量留白、中文短文字。
不是那种"AI 味很重"的海报风,是克制、干净、适合技术内容的手绘插画。
30 秒上手
npx skills add statefulai/doc-to-sketch
装完之后,在你的 AI 编程工具里说一句话就行:
Use $doc-to-sketch 把这篇文章做成 1 张封面图 + 3 张正文配图。
三条路径,看你环境
不同的 AI 工具能力不同,doc-to-sketch 自动适配:
Path A — 直接出图 如果你用 Codex 或 Claude Code(自带生图能力),直接输出 PNG 页面图。什么都不用配。
Path B — 在线出图
如果你用 Cursor、Cline 等没有原生生图的工具,配一个图片 API(比如 OpenAI 的 gpt-image-2),skill 会通过 API 帮你生成。
Path C — 先出规划 什么生图能力都没有?没关系。skill 会输出完整的 blueprint + 每页的 prompt 文件,你直接粘到 ChatGPT 或 Midjourney 里生成。
不确定自己走哪条路?装完跑一下自检:
cd ~/.agents/skills/doc-to-sketch && bash scripts/doctor.sh
飞书文档直接读
这个功能对国内用户特别有用:直接粘飞书链接,不需要导出。
Use $doc-to-sketch 把这篇飞书文档做成 1 张封面图 + 4 张正文配图。
https://xxx.feishu.cn/docx/xxxxx
首次使用会弹浏览器完成授权(只读权限,不会写你的文档,token 只存本地)。
我为什么做这个
我经常写技术文章和课程内容,每次都在配图环节卡住。试过各种 AI 画图工具,要么风格不统一,要么中文渲染一团糟,要么每次都要重新描述想要的风格。
doc-to-sketch 把风格系统固化成了一套 prompt 模板 + 视觉 DNA 规范,AI 只需要关注"画什么",不需要每次都学"怎么画"。
适合谁
- 写技术博客 / 公众号,需要配图但不想用 PPT 模板的人
- 做技术培训 / 课程,需要一套统一风格的课件插图
- 在飞书里写文档,想快速出一组配图发给团队或对外
不适合谁
- 需要可编辑 PPTX/Keynote 文件的(这不是 PPT 工具,输出是 PNG 图片)
- 需要英文或其他语言的(目前只做中文)
- 对图片里的文字有零容错要求的(AI 生图有时会出错字,建议多生几次择优)
链接
- GitHub:statefulai/doc-to-sketch
- 安装:
npx skills add statefulai/doc-to-sketch - 视觉 DNA 基于 Ian 的 ian-handdrawn-ppt(MIT License)
后续计划
目前只有一种手绘风格。下一步打算做多风格支持——把视觉系统做成可插拔的"风格包",让不同风格的设计师可以贡献自己的视觉 DNA。
如果你是设计师 / 插画师,对"AI 技术配图的视觉风格"有想法,欢迎聊聊合作 🎨
如果你试了觉得有用,GitHub 上给个 star 就是最好的反馈 ⭐