Stable Diffusion API 玩法:不同参数介绍及生成图片效果对比

941 阅读5分钟

引言
图像生成技术一直是计算机视觉领域的热门研究方向之一。稳定扩散(Stable Diffusion)方法在图像生成领域引起了广泛的关注,因为它以其出色的生成效果和强大的灵活性备受赞誉。本篇博客将带您深入了解Stable Diffusion,并探索不同参数对生成效果的影响,揭示其神奇之处。

1. Stable Diffusion介绍与商业场景

Stable Diffusion是一种基于扩散过程的图像生成方法,在计算机视觉领域引起了广泛的兴趣和关注。它的独特之处在于通过多次迭代将随机噪声逐渐转化为逼真、高质量的图像。

Stable Diffusion方法的应用前景非常广阔。首先,Stable Diffusion可以生成具有细腻纹理、清晰细节和丰富多样性的图像,成为艺术创作、图像修复和图像编辑等领域的强大工具。其次,结合深度学习模型,Stable Diffusion可用于生成逼真的人脸图像、场景重建和虚拟现实; 它不仅可以生成静态图像,还可以应用于视频生成动画制作,为电影、游戏和虚拟现实体验带来更加逼真的视觉效果。此外,Stable Diffusion具有可控性和灵活性,用户可通过调整参数控制生成图像的细节程度、多样性和收敛速度,从而在艺术创作、设计和创意表达中发挥巨大潜力。

总之,Stable Diffusion作为一种创新的图像生成方法,为我们打开了探索图像世界的新大门。其应用前景广阔,不仅在艺术领域具有巨大潜力,还在人工智能、计算机图形学和虚拟现实等领域有着广泛的应用前景。随着技术的不断发展和创新,我们可以期待Stable Diffusion方法在图像生成领域发挥更加重要和突出的作用。

2.理解Stable Diffusion参数

不同参数的使用会生成不同的图像,以下是关键参数的解释:

正面提示词 (Prompt)

描述所需图像的细节越详细,Stable Diffusion生成效果越接近描述,较少描述则更具创意性。

负面提示词 (Negative Prompt)

不希望Stable Diffusion生成的内容,用于排除不需要的元素。

采样器 (Samplers)

算法在每一步之后获取生成的图像,并与文本提示要求的内容进行比较,之后进行修改,直到逐渐达到与文本描述相匹配的图像,常用的采样器有dpm系列和euler系列,分别强调真实感和艺术感。

采样步数 (Sampling Steps)

Stable Diffusion 文生图的原理是通过从充满噪声 (noise) 的画布开始逐浙对其进行降噪处理,以达到最终输的图像效果。而采样步数这一参数就是用来控制去噪步骤数的。通常情况下该数值越高越好,但一般情况下我们使用的 25 的采样步数值就足以生成任何类型的图像了,而更多的采样步数产生的效果几乎很难看出差别,反而会浪费GPU资源。

CFG比例 (Classifier-Free Diffusion Guidance scale)

CFG比例可以看做是提示词与创造力的比例(creative vs. prompt - 图像与提示符的一致程度),较低值产生创意更强的结果,高值更贴合提示词。Stable Diffusion 中参数默认值为7,它在提示词与创造力之间取得了一个均衡的效果,所以我们一般也不会去改变该数值。通常不建议该值低于 5,因为这样会使图片看起来更像是幻觉一样;该值如果过高而你的提示词又不够详细的话,就并不一定能让生成的图像贴合提示词了,高于 16 时就可能开始给图像带来很多难看的效果图(ugly artifacts) 。

种子 (Seed)

在采样器中我们提到了噪声,而种子的数字就决定了图像生成的初始随机噪声,在我们的提示词完全相同的时候生成的图像时常也会很大的差别,就是因为你选择不同的种子,或者将种子的值默认为了随机值。反之如果我们采用相同的提示词和种子时,会生成很类似的图像。

3.不同参数下的生图效果展示

下面我们看下借助Omniinfer 这一AI图像生成工具,使用不同参数对比生成的图像效果:

  • Sampler

  • Sampling Steps

  • CFG

  • Seed

通过示例展示,可以直观地感受到Stable Diffusion在不同参数下的神奇之处,同时也展现了其在图像生成领域的巨大潜力。Stable Diffusion方法以其卓越的生成效果和灵活性,正在成为计算机视觉领域的一颗耀眼明星。然而,值得注意的是,Stable Diffusion作为一种复杂的图像生成方法,其参数的选择和调整需要一定的经验和技巧。不同的应用场景和任务可能需要不同的参数设置,而这也是未来研究的方向之一。随着技术的不断发展,我们可以期待更多关于Stable Diffusion的探索和优化,进一步提高其生成图像的质量和多样性。