Stable Diffusion 团队开源的新模型,可以绘制文字和理解图片的空间关系

647 阅读1分钟

Stable Diffusion团队开源的新模型DeepFloyd IF,官方介绍“这是一个强大的文本到图像模型,可以巧妙地将文本集成到图像中”。

1683257271146.jpg

这个模型解决了文字绘制图片的两大难题

1. 准确的绘制文字

unnamed7.jpeg

2. 理解图片中的空间关系

Fu0GzjBaQAA2hj0.png

可以准确的绘制出文字这在之前那些Ai生成图片的模型中效果都不是很好,我去官方线上体验了下效果真的很赞。不过很可惜的是目前对中文的生成效果不是很好。等对中文的支持更好的时候就可以直接拿来生成宣传海报了

体验地址:huggingface.co/spaces/Deep…
我的提示词不咋滴把大佬画成这样hahahhhh

640 (1).png

github链接: github.com/deep-floyd/…

这个模型也可以本地跑起来但是对电脑的GPU要求比较高,官方的代码demo都是放在cloab去运行的。想玩的人可以去试试,我把demo链接贴出来。不过这个是需要去申请一个Hugging Face Token,注册一个Hugging Face号然后申请下就好了。

申请地址:huggingface.co/settings/to…

代码案例:huggingface.co/DeepFloyd/I…

640 (2).png