做自媒体最痛苦的环节不是写稿,是找图。写一千字可能只要四十分钟,但找一张合适的配图,能在图库里翻一个小时。要么版权有问题,要么风格不统一,要么跟文章内容对不上。好不容易找到一张满意的,点进去发现要付费会员,而且授权范围还不包括商业用途。
我最近在库拉KULAAI(t.kulaai.cn)上用 GPT-Image-2 批量生成配图,摸索出一套建立专属素材库的方法。核心思路是:不再"找图",而是"造图"。把配图从"从外部搜索"变成"按需生产",效率直接翻倍。
为什么自媒体需要"专属素材库"?
先回答一个前置问题:网上免费图库那么多,为什么还要自己建?
三个原因。
第一,风格一致性。 你去看那些做得好的自媒体账号,不管内容怎么变,视觉风格是统一的——色调、构图、画风都有辨识度。这就是品牌感。用免费图库,每张图来自不同摄影师、不同风格,拼在一起像大杂烩。自己生成的图可以锁定同一套视觉语言,整体感完全不一样。
第二,内容匹配度。 你写一篇"远程办公的利与弊",去图库搜"remote work",出来的永远是同一个金发女性对着笔记本微笑的图。跟你文章的观点、调性完全对不上。自己生成的图可以精确匹配文章的具体论点。
第三,版权干净。 免费图库的授权条款越来越复杂,有的要求署名,有的禁止商用,有的说免费但实际是引流到付费套餐。自己生成的图,版权归属清晰,用起来安心。
第一步:建立视觉规范
建素材库之前,先定一套视觉规范。这决定了你的素材库有没有"灵魂"。
需要确定的就四个东西:
主色调: 比如"莫兰迪色系""蓝灰色调""暖橙色调"。选一个跟你的账号调性匹配的配色方案,以后所有图都用这个基调。
画风: 扁平插画、3D 渲染、手绘水彩、写实摄影、像素风——选一个,固定下来。不要今天插画风明天写实风,观众看着会分裂。
构图偏好: 居中构图、左文右图、满版出血、留白构图——看你常发的平台适合什么。公众号头图适合 16:9 宽幅,小红书适合 3:4 竖版,Twitter 适合 1:1 方图。
禁止元素: 有些东西你肯定不想要——比如真实人脸(避免肖像权问题)、特定品牌 Logo、过于写实的暴力场景。把这些写进负面提示词,一劳永逸。
我自己的规范是:莫兰迪色系,扁平插画风格,简洁构图,白色或浅灰背景,无人脸,无文字。简单但够用,出来的图放在一起非常和谐。
第二步:建立分类 Prompt 模板库
这是素材库的核心资产。不是每次写文章才想 Prompt,而是提前准备好一批模板,用的时候填参数就行。
我把模板分成五类:
场景类: "一个人在{地点}做{动作},{色调}色调,扁平插画风格"。覆盖日常场景——咖啡馆、办公室、通勤路上、户外跑步。这类图用来做文章开头的氛围配图。
概念类: "用视觉隐喻表达{概念},简洁抽象,{色调}色调"。覆盖抽象话题——效率、焦虑、成长、选择。比如"时间管理"可以生成一个沙漏和齿轮的组合图形。
数据类: "一张{图表类型}的示意图,展示{数据主题},{色调}色调,简洁设计"。虽然 AI 生成的图表不能直接当数据可视化用,但作为文章里的装饰性配图完全够用。
产品类: "一个{产品类型}的展示图,{角度}角度,{色调}色调,简洁背景"。做科技自媒体的话,这类图用来配评测文章。
情绪类: "表达{情绪}的画面,{色调}色调,{风格}风格"。开心、迷茫、专注、放松——文章结尾做情感升华的时候用。
每个模板保存好,标注用途。写文章的时候,根据段落内容选模板,填入具体参数,30 秒出一张图。
第三步:批量生成与入库
建好模板之后,可以一次性批量生成一批通用素材。
我的做法是:每个周末花一小时,把下周要发的 5-8 篇文章的标题列出来,根据主题从模板库里选 10-15 个 Prompt,批量调用 API 生成。一次生成大概 3-5 分钟,然后花 10 分钟筛选——好的入库,不好的删掉。
入库的组织方式很重要。我用的是 按日期 + 标签 的目录结构:
text
text
素材库/
├── 2026-04/
│ ├── 0426_远程办公_场景/
│ ├── 0426_AI工具_概念/
│ └── 0426_效率提升_情绪/
├── 模板/
│ ├── 场景类.txt
│ ├── 概念类.txt
│ └── ...
└── 视觉规范.txt
每个图片文件名里带上关键词标签,方便后续搜索。比如 remote_work_cafe_morandi_01.png。
和传统素材方案对比
免费图库(Unsplash、Pexels): 免费、量大,但风格杂、匹配度低、有撞图风险。适合个人博客,不适合品牌化运营。
付费图库(Shutterstock、Getty): 质量高、版权清晰,但贵,而且搜索效率依然很低。一张图 50-200 元,一个月配图成本可能上千。
自己拍/画: 风格完全可控,但门槛高、速度慢。除非你本身是设计师,否则不现实。
AI 生成: 速度快、成本低、风格可控、版权清晰。单张图质量不如顶级图库,但对自媒体配图来说绰绰有余。而且最大的优势是"按需生产"——你永远不需要在图库里翻找,描述你想要的画面,它就出来了。
一个容易忽略的点:迭代优化
素材库不是一次建好就完事的。用一段时间你会发现,有些模板出来的图特别好用,有些总是不太对。定期复盘,淘汰不好用的模板,补充新的。
另外,GPT-Image-2 本身也在迭代。模型更新之后,同样的 Prompt 可能出更好的图。建议每隔一两个月,把核心模板重新跑一遍,看看有没有质量提升,顺便更新素材库。
还有一点:把效果最好的 Prompt 保存下来。这些是你最宝贵的资产——它们代表了你对视觉风格的理解,也代表了模型对你的"偏好的学习成果"。换模型、换平台的时候,这些 Prompt 模板依然能用。
趋势:从"素材消费"到"素材生产"
过去十年,自媒体的配图逻辑一直是"消费"——从图库买、从免费站下载、从别人那里转载。AI 生图正在把这个逻辑翻转为"生产"——你不再消费别人的素材,而是生产自己的素材。
这个转变的深层影响是:视觉资产变成了内容创作者的核心壁垒之一。当每个人都能生成图片的时候,"你长什么样"比"你有没有图"更重要。专属视觉风格、高质量的 Prompt 模板库、稳定的出图流程——这些才是新的竞争壁垒。
别再花一小时找图了。花一小时建一套自己的素材生产系统,然后让它持续为你工作。