embedding模型训练
注意:如果是6G显存,使用384分辨率, 8G以上可以使用512分辨率的图片。
下面我们直接进入主题。
首先我们进行一些基础的设置。
1、设置->训练,勾选,屏蔽VAE,如果主模型下有VAE,可以进行改名进行屏蔽。
2、设置->反推设置,反推:deepbooru按字母阈值,取消,同时分数阈值设置在0.7就可以,新手建议0.7-0.75。
分数阈值如果开的越低,那么保留的图片原始细节越多,反之这个参数开的越高,过滤掉的标签越高训练的模型保持的细节也就越少。
保存以上配置。
接下来就开始进入今天的主题了。
主页面上选择“训练”,创建嵌入式模型。
名称随便起一个,这里我们使用negan_first,每个词元(token)的向量数新手推荐设置在6-8,这里设置成7。
点击创建嵌入式模型。
可以看到右边系统帮我们创建了negan_first.pt的模型文件。
接着就是准备训练的素材了,保底30张,推荐50-100张(必须是正方形),这里使用的是512*512,画风尽量保持统一。
在sd的根目录下创建个文件夹train/negan_first,在negan_first文件夹下继续创建input和output文件夹。将我们准备的50张图片放到input。
接着回到我们的webui界面,点击“图像预处理”,将刚才的input路径填写在源路径,目标路径填写output的路径(此处都使用了绝对路径)。 同时勾选“Keep original size”、“创建水平翻转副本”、“使用 BLIP 生成标签 (自然语言)”三个选项。设置完成后点击“预处理”进行处理。
等待完成以后,就可以在output文件夹里面查看了。一个文本对应一个图片。
接下来就是真正的训练了,点击“训练”。
如上图所示“嵌入式模型”就选我们创建的negan_fitst,其他参数保持默认,提示词模板选择subject_filewords.txt(角色)。
高度和宽度保持512,数据集目录就是上一步的output,日志目录随便填一个,这里为了方便,直接在train下面建了个log文件夹。步数给个1万就行。
配置完成后,点击训练嵌入式模型,接下来就是漫长的等待了。
完成以后,我们就可以使用我们训练的模型了。
直接到文生图,点击“显示/隐藏模型"的按钮,在嵌入式模型中找到我们的”negan_first“模型,直接点击,然后加上对应的提示词,就可以生成图片了。