36K star!10分钟上手的开源AI图像生成工具,操作便捷门槛低

2,065 阅读5分钟

目前AI生成图像最知名的工具就是Midjourney和Stable Diffusion,但它们的优缺点比较鲜明,Midjourney一个月30美元,比较贵;而Stable Diffusion比较吃配置,且操作较为复杂。

今天我们分享一个开源项目,它效果很好且大幅降低了AI成图的门槛,它就是:Fooocus

Fooocus 是什么

Fooocus 是一款基于 Gradio 的图像生成软件,它重新思考了 Stable Diffusion 和 Midjourney 的设计,旨在提供高质量的文本到图像的转换,同时简化用户的操作流程。

Fooocus 学习了 Stable Diffusion 的离线、开源和免费的特点,以及 Midjourney 不需要用户进行参数调整的优势。

Fooocus 集成并自动化了许多内部优化和质量改进,让用户可以忘记所有复杂的技术参数,专注于提示和图像之间的交互,以探索新的思维方式并扩展人类物种的想象力。最重要的是免费且不吃配置,只需要4G显存即可使用,比SD要求要低很多!

下面是在一台具有16GB 系统 RAM6GB VRAM的相对低端笔记本电脑(Nvidia 3060 笔记本电脑)上进行的测试。这台机器上的速度约为每次迭代 1.35 秒。相当令人印象深刻——如今配备 3060 的笔记本电脑通常价格非常可接受。

对比 Midjourney

Fooocus虽然简化了操作,但是也并没有减少功能,以下是和Midjourney功能对比的详细信息。

MidjourneyFooocus
高质量的文本到图像,无需大量即时工程或参数调整。高质量的文本到图像,无需大量即时工程或参数调整。(Fooocus 拥有基于 GPT-2 的离线提示处理引擎和大量采样改进,因此无论您的提示短如“花园中的房子”还是长至 1000 个单词,结果总是很漂亮)
V1 V2 V3 V4输入图像 -> 高档或变化 -> 变化(微妙)/变化(强)
U1 U2 U3 U4输入图像 -> 放大或变化 -> 放大 (1.5x) / 放大 (2x)
修复/上/下/左/右(平移)输入图像 -> Inpaint 或 Outpaint -> Inpaint / 上 / 下 / 左 / 右(Fooocus 使用自己的修复算法和修复模型,因此结果比所有其他使用标准 SDXL 修复方法/模型的软件更令人满意)
图片提示输入图像 -> 图像提示(Fooocus 使用自己的图像提示算法,因此结果质量和提示理解比使用标准 SDXL 方法(如标准 IP 适配器或修订版)的所有其他软件更令人满意)
--styleAdvanced -> Style
--stylizeAdvanced -> Advanced -> Guidance
—nijigithub.com/lllyasviel/…
- 质量高级->质量
- 重复高级 -> 图像编号
多重提示 (::)只需使用多行提示即可
Prompt重量你可以使用“我是(快乐:1.5)”。Fooocus使用A1111的重新加权算法,因此如果用户直接从Civitai复制提示,结果会比ComfyUI更好。 (因为如果提示是用ComfyUI的重新加权编写的,用户不太可能复制提示文本,因为他们更喜欢拖动文件)要使用嵌入,可以使用“(embedding:file_name:1.1)”
- no高级 -> 否定提示
--ar高级 -> 宽高比
洞察面输入图像->图像提示->高级->FaceSwap
描述输入图像 -> 描述

安装 Fooocus

windows

  • 下载文件后,请将其解压缩,然后运行“run.bat”。

  • 首次运行,会自动下载模型文件,需要等待一段时间。(如果你已有模型文件,可以将它们复制到以下路径,启动就会更快捷些:.\Fooocus\models\checkpoints\)

Linux

  • 克隆Fooocus的GitHub仓库,切换到Fooocus目录并创建一个新的conda环境:
git clone <https://github.com/lllyasviel/Fooocus.git>
cd Fooocus
conda env create -f environment.yaml
  • 激活新创建的conda环境并安装所需的Python包:
conda activate fooocus
pip install -r requirements_versions.txt
  • 运行以下命令以启动Fooocus:
python entry_with_update.py

以下是一个安装的最低资源需求,大家可以对照自己的平台来确认一下。

使用 Fooocus

下载完成后,就会自动打开绘图界面了。默认模式是简洁模式,只有一个输入框、生成图片区域和生成按钮。它的基础界面非常简单,勾选“Advanced”会弹出高级设置的窗口,可以调整画面宽高比、风格、图像数量、种子值、反向提示词、模型、lora 权重比值、图像锐利程度等。

直接在文本框内输入提示词,然后点击“Generate”按钮就可以生成图像了。勾选“Advanced”可以进行更多高级设置。 生成好的图像会自动保存在根目录的 outputs 文件夹内。

Fooocus 根目录的 models 文件夹内很多内容和 SD WebUI 都是相似的,用于放置 checkpoints、lora、Vae 等各种模型。 如果你有下载其他基于 SDXL1.0 训练的风格化大模型或者 lora 模型,同样可以放进对应的文件夹,然后在 Fooocus 中使用。

prompt:beautiful landscape with a lake in the foreground, with a dock, and mountains in the background, in the early morning with sunrise and mist on the lake.

Fooocus

DALL-E 3

Midjourney

项目特点

  • 离线和开源:Fooocus 是完全离线运行的,用户无需联网即可使用,同时也保证了软件的开源性。
  • 简化安装和使用:Fooocus 简化了安装过程,从下载到生成第一张图片,鼠标点击次数严格限制在3次以内。最小GPU内存需求为4GB(Nvidia)。
  • 自动化优化:Fooocus 自动化了许多内部优化,包括采样改进等,确保结果始终美观,无论用户的提示是简短还是详细。
  • 易于使用:Fooocus 设计了易于使用的界面和提示系统,用户无需进行繁琐的参数调整,只需关注提示和生成的图像。

总结

总体来说,Fooocus 是一个强大的图像生成工具,生成图片的质量很高,细节非常好,完全不输给Midjourney,并且它简化了操作,为用户提供了一个既易于使用又功能强大的平台。

无论是艺术家、设计师还是普通用户,都可以利用 Fooocus 来创造令人惊叹的视觉作品。

项目信息