我做了一个 AI Skill,丢文档就出中文手绘技术配图

0 阅读3分钟

我做了一个 AI Skill,丢文档就出中文手绘技术配图

支持 Markdown、飞书文档、PPTX、PDF,一条命令安装,三条路径适配不同 AI 编程工具

痛点

写技术文章最头疼的不是写字,是配图。

  • PPT 模板千篇一律,一眼就看出来"又是 Canva"
  • 找设计师画一张配图,来回改三次,比写文章还慢
  • AI 画图工具是有了,但每次都要从零写 prompt,出来的风格不统一
  • 飞书里写了一大篇文档,想出几张配图,还得先导出再粘贴

我想要的很简单:把文档丢进去,直接出一组风格统一的中文手绘配图。

doc-to-sketch 是什么

doc-to-sketch 是一个 AI Skill(可以理解为给 AI 编程助手装的"插件"),专门把文档内容转换成中文手绘技术解释图。

一句话描述:文档进,手绘图出。

风格长这样:

01-三条路径.png

02-丢文档出图.png

03-飞书链接.png

视觉特征:近白纸底、无边框、细手绘线条、淡色标记、中央小图、大量留白、中文短文字。

不是那种"AI 味很重"的海报风,是克制、干净、适合技术内容的手绘插画。

30 秒上手

npx skills add statefulai/doc-to-sketch

装完之后,在你的 AI 编程工具里说一句话就行:

Use $doc-to-sketch 把这篇文章做成 1 张封面图 + 3 张正文配图。

三条路径,看你环境

不同的 AI 工具能力不同,doc-to-sketch 自动适配:

04-路径选择.png

Path A — 直接出图 如果你用 Codex 或 Claude Code(自带生图能力),直接输出 PNG 页面图。什么都不用配。

Path B — 在线出图 如果你用 Cursor、Cline 等没有原生生图的工具,配一个图片 API(比如 OpenAI 的 gpt-image-2),skill 会通过 API 帮你生成。

Path C — 先出规划 什么生图能力都没有?没关系。skill 会输出完整的 blueprint + 每页的 prompt 文件,你直接粘到 ChatGPT 或 Midjourney 里生成。

不确定自己走哪条路?装完跑一下自检:

cd ~/.agents/skills/doc-to-sketch && bash scripts/doctor.sh

飞书文档直接读

这个功能对国内用户特别有用:直接粘飞书链接,不需要导出。

Use $doc-to-sketch 把这篇飞书文档做成 1 张封面图 + 4 张正文配图。
https://xxx.feishu.cn/docx/xxxxx

首次使用会弹浏览器完成授权(只读权限,不会写你的文档,token 只存本地)。

我为什么做这个

我经常写技术文章和课程内容,每次都在配图环节卡住。试过各种 AI 画图工具,要么风格不统一,要么中文渲染一团糟,要么每次都要重新描述想要的风格。

doc-to-sketch 把风格系统固化成了一套 prompt 模板 + 视觉 DNA 规范,AI 只需要关注"画什么",不需要每次都学"怎么画"。

适合谁

  • 写技术博客 / 公众号,需要配图但不想用 PPT 模板的人
  • 做技术培训 / 课程,需要一套统一风格的课件插图
  • 在飞书里写文档,想快速出一组配图发给团队或对外

不适合谁

  • 需要可编辑 PPTX/Keynote 文件的(这不是 PPT 工具,输出是 PNG 图片)
  • 需要英文或其他语言的(目前只做中文)
  • 对图片里的文字有零容错要求的(AI 生图有时会出错字,建议多生几次择优)

链接

后续计划

目前只有一种手绘风格。下一步打算做多风格支持——把视觉系统做成可插拔的"风格包",让不同风格的设计师可以贡献自己的视觉 DNA。

如果你是设计师 / 插画师,对"AI 技术配图的视觉风格"有想法,欢迎聊聊合作 🎨


如果你试了觉得有用,GitHub 上给个 star 就是最好的反馈 ⭐