Ai绘画体验(Midjourney)

4,472 阅读7分钟

这个我在组内做的分享,很简单浅显门外汉似的介绍一下AI绘画的内容,图片素材来自网络,纯粹交流学习

image.png image.png image.png image.png image.png image.png image.png

这些都是通过Midjourney这个AI绘画软件做的,尤其是最后一副获得22年8月底美国科罗拉多州博览会的美术大赛一等奖。

这引起了轩然大波,当然,Midjourney就是这个新闻背后的AI……事实上也带来了海量的用户。

根据报道,Midjourney在8月底应该只有30万左右用户,到了9月底就达到了150万+,说明8月底这次美术大赛事件对他们用户增长带来的巨大增长。

再加上用户使用门槛最低(只需要加入Discord,输入Prompt),简单、效果好、超级牛逼的冷启动,使得它破圈了,再加上本身基于Discord建立的社区不断地鼓励用户共创、增加了粘性,这个增长回路使得Midjourney不断地爆发

那么问题来了

Midjourney是啥?AI绘画?我们必须来google一下:

Midjourney是一个独立的研究实验室,探索新的思维媒介,扩大人类物种的想象力。专注于设计、人力基础设施和人工智能。

这是它们官网的介绍,比较出圈的还是他们的文本生成图片的产品- 同名Midjourney

用户主要通过Discord的bot机制,通过提交Prompt(提示词),获得图片。

Discord是什么?

Discord是2015年上线的,最初主打游戏语音连麦,基于Voip技术,由于多端支持(特别是支持网页端)、免费、上手门槛低,然后语音清晰、延时低、连接稳定这些特点,逐步获得用户的认可。

我们可以理解,它是一款专为社群设计的免费通讯社交软体,类似于LINE或Slack,但功能更为强大,自带机器人与各种程式功能,能够在上面发开自己工具,有网页版与手机版App。

Midjourney通过在Discord上创建了自己的服务器,并创建了大量的频道,以及开发了自己的机器人,用户使用“/imagine”命令生成图像,并像其他AI图像生成工具一样输入命令提示。然后机器人根通过大量图像数据上训练出的机器学习(ML)算法来生成独一无二的图像。

那我们体验一下:

1.  保姆级注册流程

2.  添加自己的服务器

3.  选择我们自己的服务器,在下方对话框中输入任何一段提示词:

image.png

hyper realistic photograph, portrait of a beautiful happy southamerican woman, big silver earings, tied hair, summer :: film grain, Kodak portra 800, f1.8, golden hour --ar 2:3 --upbeta

等待一会,机器人就会发出根据关键词生成的图片

image.png

image.png

U1,U2,U3,U4: 放大对应的图像,生成所选图的更大版本并添加更多的细节

V1,V2,V3,V4: 创建对应图像变体,生成所选图的整体风格和构图相似的新图

我选了U4

image.png

image.png

image.png

4.  可以看调出设置与预设

image.png

我们把上面关键词翻译一下:

image.png

提示语框架:主题内容+环境背景+构图镜头+参考方向+图像设定

image.png

image.png

附详细提示词框架:

image.png

框架有了,内功有了,下面该丰富武功招式了,说人话就是:收集和储备提示词词库

网上有很多,这里不附了。

image.png

人类最大的进步是会使用工具,我们可以用ChatGPT,来提供丰富的描述词思路

附:全网爆火的OpenAi!如何注册! - 知乎

image.png

提炼关键词:

一个小桥横跨在一条流水清澈的小河或小溪上,河畔边上是一些中国古代村庄,周围景色宁静、优美、舒适, 水墨风格 8k

Deepl翻译后:

A small bridge spanning a small river or stream with clear flowing water, the river is bordered by some ancient Chinese villages, the surrounding scenery is quiet, beautiful and comfortable, ink style 8k

image.png

我们来体验一下其他风格:

extremly beautiful anime waifu, illustration on pixiv, pastel colors, flat, cel shading, outlined, big blue eyes, black hair, traditional Chinese clothing, colorful, charming pose, rising light, edge light, art by shinkai Makoto, Yoneyama Mai, 8k, ultra details, --ar 9:16 —niji

极其美丽的动漫waifu,pixiv上的插图,粉色,平面,cel shading,轮廓,蓝色的大眼睛,黑色的头发,传统的中国服装,丰富多彩,迷人的姿势,上升的光线,边缘的光线,艺术由Shinkai Makoto,Yoneyama Mai,8k,超细节, --ar 9:16 --niji

cute girl, mecha, space, rocket, IP design by pop mart, blind box, Pastel, 3D, rendering, plain diffuse gradients color background, high quality, realistic --ar 3:4

可爱的女孩,机械人,太空,火箭,IP设计:POP MART,盲盒,粉彩,3D,渲染,普通漫反射渐变色背景,高质量,逼真 --ar 3:4

The Ancient City of Ping Yao, Night, Magical and mystical, Beautiful Lighting, Unreal Engine, by Ivan Shishkin --ar 16:9

平遥古城,夜晚,神奇而神秘,美丽的灯光,虚幻引擎,作者:Ivan Shishkin --ar 16:9

我们上文提到了机器学习ML算法,说到这里又三个词最近两年出现的频率越来越高。

人工智能(AI),机器学习(ML),深度学习(DL),这哥三是什么关系呢?

image.png

一文看懂人工智能、机器学习、深度学习与神经网络之间的区别与关系 - 知乎

机器学习,实现人工智能的方法,深度学习,实现机器学习的技术;

在机器学习这个领域有一个很厉害的算法 - 无监督算法对抗网络GAN, 设计的动机就是自动化,能够自己学习特征提取。

image.png

训练需要大量的人工标注数据,这个过程是成本很高且效率很低的。而人工判断生成结果的好坏也是如此,有成本高和效率低的问题。

而 GAN 能自动完成这个过程,且不断的优化,这是一种效率非常高,且成本很低的方式。GAN是如何实现自动化的呢?下面我们讲解一下他的原理。

知乎上有一个很不错的解释,大家应该都能理解:

假设一个城市治安混乱,很快,这个城市里就会出现无数的小偷。在这些小偷中,有的可能是盗窃高手,有的可能毫无技术可言。假如这个城市开始整饬其治安,突然开展一场打击犯罪的“运动”,警察们开始恢复城市中的巡逻,很快,一批“学艺不精”的小偷就被捉住了。

image.png image.png image.png

最终,我们同时得到了最强的小偷和最强的警察。

生成对抗网络(GAN)由2个重要的部分构成:

1.  生成器(Generator):通过机器生成数据(大部分情况下是图像),目的是“骗过”判别器

3.  判别器(Discriminator):判断这张图像是真实的还是机器生成的,目的是找出生成器做的“假数据”

image.png

模型经过交替优化训练,两种模型都能得到提升,但最终我们要得到的是效果提升到很高很好的生成模型(小偷),这个生成模型所生成的产品能达到真假难分的地步。

目前GAN的应用已经进入了我们生活中:

  • 预测不同年龄的长相
  • 提高照片分辨率,照片修复,照片编辑
  • 生成3d模型

回归正题

AI绘画会替代传统绘画吗? 我认为目前不会,AI绘画目前我认为冲击最大的是成长期的人,但问题是每个大佬都需要成长期...

看这个google趋势,这两年的真的开始火起来了,会是下个风口吗?

image.png