前有快手可灵,后有FLUX.1,开源图像模型有救了!
原创 Bob新视界 Bob的AI视界
大家好,我是Bob。
一个想和大家一起慢慢变富的AI程序员
热爱分享AI前瞻思考、项目经验、面试技巧。
欢迎关注我,一起探索,一起破圈!
"黑森林实验室"(Black Forest Labs)发布FLUX
一个新的开源文生图模型出现了!
由Stability AI前核心成员Robin Rombach领衔的"黑森林实验室"(Black Forest Labs)近日推出了 FLUX.1图像生成模型家族 ,引起业界广泛关注。
该公司成立伊始便获得了3200万美元的融资支持,彰显了投资者对其技术实力和发展前景的信心。
Flux一图像生成模型
在当前的AI图像生成领域, Midjourney v6.0 、 DALL·E 3 (HD )和 Stable Diffusion 3-Ultra 等模型一直处于领先地位。然而, FLUX.1的出现正在改变这一格局。
根据官方声明,FLUX.1在多个关键指标上超越了这些知名模型 :
-
• 视觉质量 :FLUX.1生成的图像细节更丰富,色彩更鲜明,整体质量更高。
-
• 提示跟随 :相比其他模型,FLUX.1能更准确地理解和执行用户的文本提示。
-
• 大小/纵横比变化 :FLUX.1在处理不同尺寸和比例的图像时表现更加灵活。
-
• 排版能力 :在处理包含文字的图像时,FLUX.1展现出优秀的排版和布局能力。
-
• 输出多样性 :FLUX.1能生成更加多样化的图像,为用户提供更多创意选择。
-
**
**
技术突破
FLUX.1的发布在社交媒体上引发了热烈讨论,许多用户对模型生成手指的能力赞不绝口。众所周知,准确生成人手和手指一直是AI图像生成模型面临的一大挑战。
许多模型在这方面常常出现错误,比如手指数量不正确或形状怪异等问题,FLUX.1在这一难题上取得了突破性进展。
用户反馈显示,FLUX.1生成的手指更加自然、准确,无论是手指的数量还是姿势都更符合现实。这一优势不仅提高了生成图像的整体质量,也大大增加了模型在人物肖像、手部特写等场景中的实用性。
这一进步可能源于FLUX.1的创新架构和先进的训练方法。黑森林实验室可能在模型训练过程中特别关注了手部细节的处理,或者采用了更优秀的数据集和算法来改善这一常见问题。无论如何,这个特点都凸显了FLUX.1在细节处理上的卓越能力。
从技术角度来看,FLUX.1模型拥有120亿参数,这个规模使它能够处理复杂的图像生成任务,同时保持较高的效率。黑森林实验室的核心团队阵容强大,包括多位在机器学习和生成式AI领域有深厚背景的专家。他们的贡献包括创建VQGAN和Latent Diffusion,以及参与开发Stable Diffusion等知名项目。这支团队的丰富经验为FLUX.1的成功奠定了坚实基础。
开源!!!
在开放性方面,黑森林实验室表现出了可贵的诚意。FLUX.1 [dev]和FLUX.1 [schnell]的模型权重和推理代码已在HuggingFace和GitHub上公开,方便开发者使用和二次开发。同时,用户可以通过Replicate和fal.ai等平台在线体验FLUX.1的强大功能。
【黑森林实验室】 blackforestlabs.ai/
【FLUX1模型下载】 huggingface.co/black-fores…
【demo】 huggingface.co/spaces/blac…...
【工作流】 comfyanonymous.github.io/Comf...
【Tost平台】 tost.ai/
【Glif平台】 glif.app/glifs