ComfyUI 中常见英文缩写详解

272 阅读3分钟

以下是 ComfyUI 中常见英文缩写及其全称和含义的详细解释,帮助你更好地理解这些术语:


1. VAE

  • 全称:Variational Autoencoder(变分自编码器)
  • 作用:在 Stable Diffusion 中,VAE 负责在**像素图像(IMAGE)潜在空间表示(LATENT)**之间进行转换。
    • VAE Encode:将图像压缩到潜在空间(用于图生图)。
    • VAE Decode:将潜在表示还原为可视图像(生成最终结果)。
  • 注意:有些模型自带 VAE,也可单独加载优化版 VAE(如 vae-ft-mse-840000-ema-pruned.safetensors)以提升画质。

2. CLIP

  • 全称:Contrastive Language–Image Pretraining
  • 作用:一种多模态模型,能将文本提示词(如 "a cat on a sofa")编码为模型可理解的向量(embeddings),供扩散模型使用。
  • 在 ComfyUI 中,CLIP Text Encode 节点就是调用 CLIP 将提示词转为“条件”(conditioning),输入给采样器。

3. LoRA

  • 全称:Low-Rank Adaptation(低秩自适应)
  • 作用:一种轻量级微调技术,通过在原始模型权重上叠加低秩矩阵,实现对特定风格、角色或概念的快速适配。
  • 优点:文件小(通常几 MB 到 150MB)、加载快、可叠加多个。
  • 在 ComfyUI 中通过 Lora Loader 节点加载。

4. ControlNet

  • 全称:无标准全称,通常理解为 “Control Network”(控制网络)
  • 作用:一种条件控制技术,允许用户通过边缘图、深度图、姿态图等引导图像生成,实现精准构图。
  • 需配合预处理器(如 Canny、OpenPose)和ControlNet 模型使用。

5. CFG(常出现在 KSampler 设置中)

  • 全称:Classifier-Free Guidance(无分类器引导)
  • 作用:控制生成图像与提示词的匹配程度
    • 值太低(如 1–3):图像自由但可能偏离提示。
    • 值太高(如 15+):过度锐化、失真。
    • 常用范围:7–12。

6. Latent / LATENT

  • 中文:潜在空间 / 隐空间
  • 解释:Stable Diffusion 不直接在像素空间操作,而是在一个压缩的潜在空间中进行去噪和生成。
    • 图像 → VAE Encode → LATENT(低维表示)
    • LATENT → KSampler(去噪)→ VAE Decode → 图像
  • 优点:计算效率高,节省显存。

7. KSampler

  • 名称来源:并非标准缩写,而是 ComfyUI 对采样器(Sampler)的命名。
  • “K” 可能含义:代表“Kernel”或仅为命名风格(类似 K-diffusion 库)。
  • 作用:执行扩散模型的去噪采样过程,是生成图像的核心节点。
  • 支持多种采样算法:Euler、DPM++、DDIM、UniPC 等。

8. SD / Stable Diffusion

  • 虽然不是节点名,但常出现在模型文件名中(如 sd_xl_base_1.0.safetensors)。
  • Stable Diffusion:由 Stability AI 开发的文本到图像生成模型。

9. IMAGE / LATENT / MODEL / CLIP(节点输出类型)

这些是 ComfyUI 中的数据类型标识,不是缩写,但需理解其含义:

  • IMAGE:像素图像(H×W×3 的张量,范围 [0,1])
  • LATENT:潜在空间张量(通常 4×H/8×W/8)
  • MODEL:Stable Diffusion 的 UNet 主干模型
  • CLIP:文本编码器(用于生成文本嵌入)

10. ESRGAN / SwinIR(超分模型)

  • ESRGAN:Enhanced Super-Resolution GAN(增强型超分辨率生成对抗网络)
  • SwinIR:基于 Swin Transformer 的图像复原模型
  • 用于 Image Upscale With Model 节点,对生成图像进行高清放大。

总结表:

缩写全称作用
VAEVariational Autoencoder图像 ↔ 潜在空间转换
CLIPContrastive Language–Image Pretraining文本提示编码
LoRALow-Rank Adaptation轻量级模型微调
ControlNetControl Network条件控制生成(如姿势、边缘)
CFGClassifier-Free Guidance提示词引导强度
Latent潜在空间表示(非像素)
KSampler核心图像采样生成节点

理解这些缩写和概念,能帮助你更清晰地构建和调试 ComfyUI 工作流。