人工智能技术巨头之间的冲突加速了智能绘图工具的兴起,哪个工具将获得最高荣誉?
人工智能生成艺术的时代正在如火如荼地进行,三大巨头已成为数字创作者们最喜爱的工具:Stable Diffusion v1.5、SDXL 以及它们的主要竞争对手:MidJourney。
MidJourney:人工智能艺术的入门钥匙
作为三者中最友好的一个,MidJourney 可以让AI创作小白也能很轻松的进行创作,因其友好的 Discord 界面而深受初学者们的喜爱,只需向描述框输入文本提示,几分钟之内您就得到了一幅美学杰作。
从功能上讲,MidJourney 可根据文本提示快速生成图像,具有令人印象深刻的美学凝聚力,MidJourney 喜欢在每一幅创作中融入自己的风格,因此,大多数图像颜色的色相可识别性更高,并且往往比真实感更逼真,人们可以根据这一特点来识别 MidJourney 创作的图像。
但是在 MidJourney 中,您的创作自由度会受到平台严格的内容规则的限制,它在社会上(在描绘裸体或暴力方面)和政治上(在有争议的话题和特定领导人方面)都受到严格审查。总体而言,MidJourney 将会大大减少你的创作时间和带来更加丰富的创作灵感。
Stable Diffusion v1.5:人工智能艺术的普及
Stable Diffusion v1.5 作为一个已经积极开发了一年多的开源模型,已经为数以万计的AI艺术创作者们提供了技术支持,我们可以在 抖资源AI 这个平台中免费使用。
通过在描述框中输入文本提示词,Stable Diffusion v1.5 可以生成符合您预期的图像。目前,它是唯一支持修复图像(更改图像内部内容)的技术。它还支持第三方插件,如 roop(用于创建 Deepfakes)、After Detailer(用于改进面部和手部)、Open Pose(用于模仿特定姿势)和区域提示。
SDXL:人工智能艺术的下一个前沿
如果 Stable Diffusion v1.5 是可靠的主力,那么 SDXL 就是在赛道上驰骋的年轻纯种马,SDXL 利用双文本编码器更好地分析提示词,其生成过程在高分辨率下实现了卓越的图像一致性。
这些功能听起来令人兴奋,但它们也让 SDXL 更难掌握,一种文本编码器喜欢简短的自然语言,另一种则喜欢使用 SD v1.5 的截断、特定关键字风格来描述成分,两阶段生成意味着需要一个细化器模型将细节放入主图像中,这需要一定的时间、RAM 和计算能力,但结果是美丽的。
SDXL支持稳定扩散 v1.5 近 3 倍的参数,毫不费力地生成比其大近 50% 的图像分辨率。但这种前沿性能是有代价的:SDXL 需要具有至少 6GB VRAM 的 GPU,需要更大的模型文件,但是不可否认的是 SDXL 的潜力是不可估量的。
输出比较
一张图片胜过一千个文字描述,下面我们直接上图,对比一下3款工具输出的图像成像效果:
提示词:柯基犬骑自行车穿越大海的肖像
评论:SDXL 和 MidJourney 击败了 Stable Diffusion v1.5,因为他们二者的细节更加的丰富也更加的贴合提示词。
提示词:夜晚的城堡
点评:MidJourney 试图在打造一个远景的城堡,SDXL v1.0 更清晰,但 SD v.15 的颜色对比度更好。
提示词:为机器提供动力的大脑
评论:MidJourney 和 SDXL 都产生了符合提示的结果。SDXL 更好地再现了艺术风格,而 MidJourney 更注重制作美观的图像而不是再现艺术风格,它也丢失了许多提示细节(例如:图像没有显示为机器提供动力的大脑,而是显示了为机器提供动力的头骨)。
生成艺术的未来
已经在为选择什么工具而开始发愁了?坦率地说,这些选项中的任何一个都不会出错。MidJourney 在可用性和美学凝聚力方面表现出色。Stable Diffusion v1.5 提供可定制性,使用起来更加的灵活。SDXL 突破了照片级真实感图像生成的界限。
现在画笔就在你手中,空白的画布正在等待着你,拿起你选择的生成工具并开始创作吧!