Stable Diffusion vs Disco Diffusion
随着 Stable Diffusion, Dalle-2, Midjourney, Disco Diffusion, Imagen 等优秀产品的流行, 人们正在进入一个AI生成图像和内容的新时代.
这里将简单比较一下 Stable Diffusion 和 Disco Diffusion 这两种模型的生成结果.
Stable Diffusion
Stable Diffusion 是一个来自 Stability AI 的开源 Text-to-Image 模型. 像 Dalle-2 一样, 它可以在几秒钟内根据文本提示生成图像.
Stable Diffusion 的一个突破是在生成质量和生成速度之间做到了良好的平衡, 甚至可以在 VRAM 不到 16G 的单个 GPU 上运行,并保证合理质量的结果. 根据官方的说明, 该模型可以与 AMD 和 Apple M1/M2 芯片组配合使用. 因此可以在个人计算机上的众多应用程序中运行这个"十亿美元的模型".
预训练模型: huggingface.co/CompVis/sta…
Disco Diffusion
Disco Diffusion 是一种片段引导型的扩散模型, 可以通过文本提示生成惊人的图像结果, 并且在生成抽象风格方面表现非常出色, 生成结果具有生动的色彩组合, 以及令人惊叹的图像构图和细节.
Disco Diffusion 起源于 Katherine Crowson 的笔记本, 以及她精细调整过的扩散模型, 然后由许多其他开发人员进行了演进和优化. 就像 Openai 的 CLIP 和 Openclip 等项目一样.
图片对比
在以下对比中, 将使用相同的 prompt 以生成图像.
Prompt: a boy looks outside his bedroom window to see the beautiful cosmos, trending on artstation
Stable Diffusion
Disco Diffusion
Prompt: Interstellar and inception, 4k resolution incredible digital illustration trending on artstation
Stable Diffusion
Disco Diffusion
Prompt: a supersonic highway of light that allows you to drive through time into the future, by john philip falter and beeple, 8k resolution digital art trending on artstation
Stable Diffusion
Disco Diffusion
Stable Diffusion 和 Disco Diffusion 都能够通效果丰富的生成结果, 释放用户惊人的创造力和想象力.
一些要点: Stable Diffusion 在生成速度和图像质量之间有更好的平衡, 可以在几秒钟内生成图像, 而 Disco Diffusion 通常需要几分钟 (5-20分钟, 具体取决于 GPU 规格, 图像大小和参数)
- Stable Diffusion 在图像连贯性方面更强
- Disco Diffusion 擅长处理详细和复杂的文本
- Disco Diffusion 更具"艺术性", 生成结果具有生动的颜色, 并时常有意外的组合
- Disco Diffusion 可调参数较多, 可以通过微调生成出不同风格和质量的图像, 而 Stable Diffusion 可调参数较少, 更容易使用
无论是 Stable Diffusion, Disco Diffusion 还是其它 AI 生成模型, 这个领域具有巨大的潜力, 可以改变人们表达思想和与人沟通的方式.