以下是 ComfyUI 中常见英文缩写及其全称和含义的详细解释,帮助你更好地理解这些术语:
1. VAE
- 全称:Variational Autoencoder(变分自编码器)
- 作用:在 Stable Diffusion 中,VAE 负责在**像素图像(IMAGE)和潜在空间表示(LATENT)**之间进行转换。
- VAE Encode:将图像压缩到潜在空间(用于图生图)。
- VAE Decode:将潜在表示还原为可视图像(生成最终结果)。
- 注意:有些模型自带 VAE,也可单独加载优化版 VAE(如
vae-ft-mse-840000-ema-pruned.safetensors)以提升画质。
2. CLIP
- 全称:Contrastive Language–Image Pretraining
- 作用:一种多模态模型,能将文本提示词(如 "a cat on a sofa")编码为模型可理解的向量(embeddings),供扩散模型使用。
- 在 ComfyUI 中,
CLIP Text Encode节点就是调用 CLIP 将提示词转为“条件”(conditioning),输入给采样器。
3. LoRA
- 全称:Low-Rank Adaptation(低秩自适应)
- 作用:一种轻量级微调技术,通过在原始模型权重上叠加低秩矩阵,实现对特定风格、角色或概念的快速适配。
- 优点:文件小(通常几 MB 到 150MB)、加载快、可叠加多个。
- 在 ComfyUI 中通过
Lora Loader节点加载。
4. ControlNet
- 全称:无标准全称,通常理解为 “Control Network”(控制网络)
- 作用:一种条件控制技术,允许用户通过边缘图、深度图、姿态图等引导图像生成,实现精准构图。
- 需配合预处理器(如 Canny、OpenPose)和ControlNet 模型使用。
5. CFG(常出现在 KSampler 设置中)
- 全称:Classifier-Free Guidance(无分类器引导)
- 作用:控制生成图像与提示词的匹配程度。
- 值太低(如 1–3):图像自由但可能偏离提示。
- 值太高(如 15+):过度锐化、失真。
- 常用范围:7–12。
6. Latent / LATENT
- 中文:潜在空间 / 隐空间
- 解释:Stable Diffusion 不直接在像素空间操作,而是在一个压缩的潜在空间中进行去噪和生成。
- 图像 → VAE Encode → LATENT(低维表示)
- LATENT → KSampler(去噪)→ VAE Decode → 图像
- 优点:计算效率高,节省显存。
7. KSampler
- 名称来源:并非标准缩写,而是 ComfyUI 对采样器(Sampler)的命名。
- “K” 可能含义:代表“Kernel”或仅为命名风格(类似 K-diffusion 库)。
- 作用:执行扩散模型的去噪采样过程,是生成图像的核心节点。
- 支持多种采样算法:Euler、DPM++、DDIM、UniPC 等。
8. SD / Stable Diffusion
- 虽然不是节点名,但常出现在模型文件名中(如
sd_xl_base_1.0.safetensors)。 - Stable Diffusion:由 Stability AI 开发的文本到图像生成模型。
9. IMAGE / LATENT / MODEL / CLIP(节点输出类型)
这些是 ComfyUI 中的数据类型标识,不是缩写,但需理解其含义:
- IMAGE:像素图像(H×W×3 的张量,范围 [0,1])
- LATENT:潜在空间张量(通常 4×H/8×W/8)
- MODEL:Stable Diffusion 的 UNet 主干模型
- CLIP:文本编码器(用于生成文本嵌入)
10. ESRGAN / SwinIR(超分模型)
- ESRGAN:Enhanced Super-Resolution GAN(增强型超分辨率生成对抗网络)
- SwinIR:基于 Swin Transformer 的图像复原模型
- 用于
Image Upscale With Model节点,对生成图像进行高清放大。
总结表:
| 缩写 | 全称 | 作用 |
|---|---|---|
| VAE | Variational Autoencoder | 图像 ↔ 潜在空间转换 |
| CLIP | Contrastive Language–Image Pretraining | 文本提示编码 |
| LoRA | Low-Rank Adaptation | 轻量级模型微调 |
| ControlNet | Control Network | 条件控制生成(如姿势、边缘) |
| CFG | Classifier-Free Guidance | 提示词引导强度 |
| Latent | — | 潜在空间表示(非像素) |
| KSampler | — | 核心图像采样生成节点 |
理解这些缩写和概念,能帮助你更清晰地构建和调试 ComfyUI 工作流。