ComfyUI 中常见英文缩写详解

2025-09-24 272 阅读3分钟

以下是 ComfyUI 中常见英文缩写及其全称和含义的详细解释，帮助你更好地理解这些术语：

1. VAE

全称：Variational Autoencoder（变分自编码器）
作用：在 Stable Diffusion 中，VAE 负责在**像素图像（IMAGE）和潜在空间表示（LATENT）**之间进行转换。
- VAE Encode：将图像压缩到潜在空间（用于图生图）。
- VAE Decode：将潜在表示还原为可视图像（生成最终结果）。
注意：有些模型自带 VAE，也可单独加载优化版 VAE（如 vae-ft-mse-840000-ema-pruned.safetensors）以提升画质。

2. CLIP

全称：Contrastive Language–Image Pretraining
作用：一种多模态模型，能将文本提示词（如 "a cat on a sofa"）编码为模型可理解的向量（embeddings），供扩散模型使用。
在 ComfyUI 中，CLIP Text Encode 节点就是调用 CLIP 将提示词转为“条件”（conditioning），输入给采样器。

3. LoRA

全称：Low-Rank Adaptation（低秩自适应）
作用：一种轻量级微调技术，通过在原始模型权重上叠加低秩矩阵，实现对特定风格、角色或概念的快速适配。
优点：文件小（通常几 MB 到 150MB）、加载快、可叠加多个。
在 ComfyUI 中通过 Lora Loader 节点加载。

4. ControlNet

全称：无标准全称，通常理解为 “Control Network”（控制网络）
作用：一种条件控制技术，允许用户通过边缘图、深度图、姿态图等引导图像生成，实现精准构图。
需配合预处理器（如 Canny、OpenPose）和ControlNet 模型使用。

5. CFG（常出现在 KSampler 设置中）

全称：Classifier-Free Guidance（无分类器引导）
作用：控制生成图像与提示词的匹配程度。
- 值太低（如 1–3）：图像自由但可能偏离提示。
- 值太高（如 15+）：过度锐化、失真。
- 常用范围：7–12。

6. Latent / LATENT

中文：潜在空间 / 隐空间
解释：Stable Diffusion 不直接在像素空间操作，而是在一个压缩的潜在空间中进行去噪和生成。
- 图像 → VAE Encode → LATENT（低维表示）
- LATENT → KSampler（去噪）→ VAE Decode → 图像
优点：计算效率高，节省显存。

7. KSampler

名称来源：并非标准缩写，而是 ComfyUI 对采样器（Sampler）的命名。
“K” 可能含义：代表“Kernel”或仅为命名风格（类似 K-diffusion 库）。
作用：执行扩散模型的去噪采样过程，是生成图像的核心节点。
支持多种采样算法：Euler、DPM++、DDIM、UniPC 等。

8. SD / Stable Diffusion

虽然不是节点名，但常出现在模型文件名中（如 sd_xl_base_1.0.safetensors）。
Stable Diffusion：由 Stability AI 开发的文本到图像生成模型。

9. IMAGE / LATENT / MODEL / CLIP（节点输出类型）

这些是 ComfyUI 中的数据类型标识，不是缩写，但需理解其含义：

IMAGE：像素图像（H×W×3 的张量，范围 [0,1]）
LATENT：潜在空间张量（通常 4×H/8×W/8）
MODEL：Stable Diffusion 的 UNet 主干模型
CLIP：文本编码器（用于生成文本嵌入）

10. ESRGAN / SwinIR（超分模型）

ESRGAN：Enhanced Super-Resolution GAN（增强型超分辨率生成对抗网络）
SwinIR：基于 Swin Transformer 的图像复原模型
用于 Image Upscale With Model 节点，对生成图像进行高清放大。

总结表：

缩写	全称	作用
VAE	Variational Autoencoder	图像 ↔ 潜在空间转换
CLIP	Contrastive Language–Image Pretraining	文本提示编码
LoRA	Low-Rank Adaptation	轻量级模型微调
ControlNet	Control Network	条件控制生成（如姿势、边缘）
CFG	Classifier-Free Guidance	提示词引导强度
Latent	—	潜在空间表示（非像素）
KSampler	—	核心图像采样生成节点

理解这些缩写和概念，能帮助你更清晰地构建和调试 ComfyUI 工作流。