今天介绍小白开始AI绘画,都要面临的一个问题,看到了很好看的图片,却不清楚如何描述,如何制作类似的图片。花了大量时间反复调试、修改提示词,生成的图片总与预想的画面不同,
这里就需要一个工具,提示词反推。
它的作用就是根据图片,反推出图片的内容提示词。也可以直接生成 Stable Diffusion 或 MidJourney 的提示词。甚至用于图像打标签,以更好的为训练模型做准备。
提示词反推,核心是基于图像理解,描述画面内容。并生成不同风格的提示词。
下面是几种风格的提示词反推效果:
原图:
JOY Caption提示词反推工作流详解
提示词反推有很多种实现,今天我们介绍的这个是基于joyCaption实现的。
整个工作流也比较简单。一种只需要4个几点。
-
图像加载
-
模型加载
-
Joy Caption Two推示词反推
-
文本展示
图像加载节点我们使用了“加载并缩放图像”。避免有的图片过大,导致反推太慢。
-
宽高设置:1024 * 1024。
-
kee_proportion:true,代表保持图像缩放比例。
Joy Caption Two节点
-
caption_type:选择提示词风格。
-
caption_length:可以调整提示词的长度
提示词效果
下面是根据反推出的SD提示词,出的效果图。
模型使用我们前面用到的dreamshaper 和 promemix。如果不会,可以这篇文章。去掉lora节点就可以了。
在线工作流获取
JOY Caption的使用,需要机器配置较高。我使用的是liblib在线工作流搭建的。
可以直接发布成应用,也可以分享工作流。
地址:
工作流下载
工作流JSON文件我放在网盘了,需要的可以公众号后台回复【250915】获取。