Stable Diffusion vs Disco Diffusion

988 阅读2分钟

Stable Diffusion vs Disco Diffusion

随着 Stable Diffusion, Dalle-2, Midjourney, Disco Diffusion, Imagen 等优秀产品的流行, 人们正在进入一个AI生成图像和内容的新时代.

这里将简单比较一下 Stable Diffusion 和 Disco Diffusion 这两种模型的生成结果.

Stable Diffusion

Stable Diffusion 是一个来自 Stability AI 的开源 Text-to-Image 模型. 像 Dalle-2 一样, 它可以在几秒钟内根据文本提示生成图像.

Stable Diffusion 的一个突破是在生成质量和生成速度之间做到了良好的平衡, 甚至可以在 VRAM 不到 16G 的单个 GPU 上运行,并保证合理质量的结果. 根据官方的说明, 该模型可以与 AMD 和 Apple M1/M2 芯片组配合使用. 因此可以在个人计算机上的众多应用程序中运行这个"十亿美元的模型".

预训练模型: huggingface.co/CompVis/sta…

Disco Diffusion

Disco Diffusion 是一种片段引导型的扩散模型, 可以通过文本提示生成惊人的图像结果, 并且在生成抽象风格方面表现非常出色, 生成结果具有生动的色彩组合, 以及令人惊叹的图像构图和细节.

Disco Diffusion 起源于 Katherine Crowson 的笔记本, 以及她精细调整过的扩散模型, 然后由许多其他开发人员进行了演进和优化. 就像 Openai 的 CLIP 和 Openclip 等项目一样.

图片对比

在以下对比中, 将使用相同的 prompt 以生成图像.

Prompt: a boy looks outside his bedroom window to see the beautiful cosmos, trending on artstation

Stable Diffusion

StableDiffusion-1.png Disco Diffusion

DiscoDiffusion-1.png

Prompt: Interstellar and inception, 4k resolution incredible digital illustration trending on artstation

Stable Diffusion

StableDiffusion-2.png Disco Diffusion

DiscoDiffusion-2.png

Prompt: a supersonic highway of light that allows you to drive through time into the future, by john philip falter and beeple, 8k resolution digital art trending on artstation

Stable Diffusion

StableDiffusion-3.png Disco Diffusion

DiscoDiffusion-3.png Stable Diffusion 和 Disco Diffusion 都能够通效果丰富的生成结果, 释放用户惊人的创造力和想象力.

一些要点: Stable Diffusion 在生成速度和图像质量之间有更好的平衡, 可以在几秒钟内生成图像, 而 Disco Diffusion 通常需要几分钟 (5-20分钟, 具体取决于 GPU 规格, 图像大小和参数)

  • Stable Diffusion 在图像连贯性方面更强
  • Disco Diffusion 擅长处理详细和复杂的文本
  • Disco Diffusion 更具"艺术性", 生成结果具有生动的颜色, 并时常有意外的组合
  • Disco Diffusion 可调参数较多, 可以通过微调生成出不同风格和质量的图像, 而 Stable Diffusion 可调参数较少, 更容易使用

无论是 Stable Diffusion, Disco Diffusion 还是其它 AI 生成模型, 这个领域具有巨大的潜力, 可以改变人们表达思想和与人沟通的方式.