纯文本模型竟然也能直接“画图”,而且还很好用

0 阅读7分钟

很多人一说 AI 画图,想到的还是文生图:输入一句 Prompt,输出一张 PNG 或 JPG。

但如果你的目标不是艺术感很强的海报,而是更偏信息表达和工程可控的图片,比如:公众号配图、技术文章插图、流程示意图、简单 Logo、头像草稿、图标,那么有一条非常实用的路:直接让文本模型输出 SVG。

原因很简单:SVG 本质上是文本。

而文本模型最擅长的,就是生成结构化文本。它也许不直接产出二进制图片文件,但完全可以通过输出 SVG 代码,把“画图”这件事完成得相当不错。

为什么 SVG 特别适合文本模型

SVG 不是像素点阵,而是一组可以被浏览器渲染的图形描述。矩形、圆角框、箭头、线条、文字、颜色、描边,本质上都能用标签和参数表达。

比如一张流程图,拆开可能只是:一个标题、三个步骤框、两条连接箭头、不同状态色块,以及底部备注。对模型来说,这和写 HTML、JSON、Markdown 很像,都是“按规则生成结构”。

所以很多时候,让模型直接写 SVG,比让它“凭空生成一张复杂图片”更稳定、更可控。

这招为什么实用

第一,可修改。 普通图片改一个细节,往往要重画;SVG 可以直接改颜色、尺寸、文案、位置。

第二,可版本管理。 它是文本文件,能放进 Git,能比对修改记录,也适合团队协作。

第三,适合轻量内容生产。 很多文章配图、封面装饰图、结构图,并不需要高度写实,只要表达清楚、风格统一就够了。SVG 正好满足这类需求。

第四,容易嵌入工作流。 你可以把它放进网页、文档、自动化脚本,甚至做成模板,批量替换标题、主题色和尺寸。

它最适合画什么

SVG 并不适合所有场景。

它更适合:

  • 扁平插画
  • 图标和 Logo 草稿
  • 流程图、结构图、关系图
  • 简单角色头像
  • 封面装饰图

它不太适合:

  • 写实人像
  • 高细节复杂场景
  • 强光影质感图
  • 电影级视觉海报

如果你要的是清楚、好改、能复用的图,SVG 往往比追求视觉冲击力更合适。

怎么让模型更容易画对

如果你想让模型稳定输出可用 SVG,Prompt 最好包含四类信息。

1. 画布约束

比如指定:

  • 宽高 512x512
  • viewBox="0 0 512 512"
  • 居中构图

2. 风格约束

比如:

  • 扁平风
  • 简洁
  • 科技感或产品图风格
  • 配色不超过 6 种

3. 元素约束

不要只说“画一张流程图”,而要写清楚:标题、步骤节点、连接箭头、说明文字、状态颜色、对齐方式都要出现。

4. 输出约束

这一点特别关键:

只输出 SVG 代码,不要解释,不要使用 Markdown 代码块。

否则模型很容易先解释一大段,结果你还得手动清洗。

一个很好用的工作流

它最实用的地方,是你可以在原图基础上不断微调。

第一轮先让模型生成基础图。 第二轮再继续说:

  • 节点改成圆角矩形
  • 箭头更粗一点
  • 主流程改成蓝色系
  • 底部加一句总结说明
  • 更适合公众号文章配图

因为模型能直接看到上一版 SVG,所以它通常会沿着原来的结构继续改,而不是每次都从头来过。

所以它不只是拿来出图,更像一个能陪你一起改图的代码助手。

这项能力真正说明了什么

很多人会把这件事理解成“文本模型也会画画了”。

更贴切的说法是:它更像是在写可视化代码。

也就是说,模型不是像人在画布上直接作画,而是在生成一段能被渲染成图像的结构化描述。SVG 是这样,Mermaid 图、HTML 卡片、流程图 DSL,本质上也类似。

这件事有意思的地方,不只是多了一个画图技巧,而是再次说明:只要最终产物还是文本,文本模型往往就能派上用场。

可直接套用的低门槛 Prompt

如果你不想每次都从头写一大段提示词,可以直接保存下面这个模板。真正需要替换的,通常只有两处:

  • 主题
  • 参考内容

其他规则提前写死,后面直接复用就行。

请你输出一个完整可运行的 SVG 文件代码,用来生成一张信息表达型配图。

你必须遵守以下固定规则:
1. 输出必须是纯 SVG 代码,不要解释,不要添加 Markdown 代码块。
2. 画布大小固定为 512x512,viewBox 固定为 0 0 512 512。
3. 整体风格固定为:扁平、简洁、科技感、适合中文内容配图。
4. 配色控制在 4 到 6 种,颜色要统一,不要杂乱。
5. 构图要求居中、清晰、有层级,保证在公众号文章中也容易看懂。
6. 默认适合画流程图、结构图、关系图、步骤图,不要做写实风,不要做复杂插画。
7. 所有文字都要简短,单个节点文字尽量控制在 4 到 10 个字以内。
8. 图中元素之间要有明确对齐和留白,不要拥挤。
9. 如果参考内容里有步骤、层级或关系,请优先转成流程节点、连接箭头、分组容器、说明标签这些标准元素。
10. 所有连线都必须从一个节点边缘准确连接到另一个节点边缘,不允许出现悬空箭头、断开的折线或指向空白区域的连线。

下面是我这次真正要你替换的内容:

主题:{{在这里替换成你的主题}}

参考内容:{{在这里粘贴你的要点、段落、流程、结构说明或文章摘要}}

请根据“主题”和“参考内容”,自动完成以下工作:
- 提炼成适合画图的结构
- 自动决定用流程图、结构图或关系图表达
- 自动生成标题、节点、连接关系和简短说明
- 先明确节点之间的连接关系,再输出准确的坐标和连线
- 如果你具备文件写入能力,请直接生成 .svg 文件并告诉我输出路径;如果不具备,则只输出完整 SVG 代码

比如把下面这个参考示例套进上面的 Prompt 模板:

主题:一个典型 Web 产品的系统架构图

参考内容:用户通过浏览器或手机访问系统。请求先经过 CDN 和负载均衡。然后进入 Web 应用和 API 服务。API 服务会访问 Redis 缓存和 MySQL 数据库。图片和附件存放在对象存储。部分耗时任务通过消息队列交给异步任务处理。所有服务都接入日志、监控和告警系统。

你就能得到一张类似下面这样的 SVG 图:

image.png

结语

如果你要的是流程图、结构图、系统示意图这类信息图,它通常比直接让模型随机出一张图更容易控制。

生成之后能改文字、改颜色、改布局,也更方便放进自己的内容和工作流里。

所以它不一定适合所有图片场景,但在这类需求里,确实很好用。