在线教程丨Qwen-Image-2512正式开源,告别AI生图塑料感,仅需文字指令实现真实毛发

68 阅读3分钟

一直以来,开源图像生成模型虽能快速出图,但在追求极致真实感,尤其在处理人像和复杂自然场景时,往往不尽如人意。生成的人脸常有「塑料感」或五官模糊,皮肤缺乏真实纹理。对于自然风光,模型在表现水体、植被等细腻质感时也常显生硬。 此外,在需要生成包含清晰文字、数据图表或复杂排版的设计图时,模型的表现更是参差不齐。这些「AI 味」过重的痕迹,使得图像难以达到专业商用或艺术创作的要求。

基于此,阿里通义实验室近日开源了新一代图像生成模型 Qwen-Image-2512。 该模型是 2025 年 8 月发布的 Qwen-Image 基座模型的重大迭代版本。它的特点非常鲜明,聚焦于三大核心能力的飞跃式提升:

更真实的人物质感:** 能精准刻画皮肤纹理、发丝走向乃至细微的表情神态,彻底告别「塑料脸」。

更细腻的自然纹理:** 对水流、动物毛发、植物表面等自然元素的细节呈现更为逼真,极大增强了画面的沉浸感。

更强的复杂文字渲染:** 不仅能生成清晰的文字,还能直接创作包含时间轴、技术图表甚至多格漫画的专业级信息图。

Qwen-Image-2512 的创新性在于通过系统性优化,显著弥合了开源模型与顶级闭源模型在「真实感」与「实用性」上的差距。在技术层面,这个拥有 200 亿参数的多模态扩散 Transformer(MMDiT)模型,通过在 AI Arena 平台上超过一万轮的盲测,证明了其综合性能的强大,用户仅需文字指令即可一键生成可直接用于演示的 PPT 或信息图,极大地拓展了 AI 图像生成在专业设计场景下的应用边界。

目前,「Qwen-Image-2512:更真实的人像与自然风光生成」已上线 HyperAI 官网(hyper.ai)的教程版块, 快来输出无限创意吧!

在线体验:go.hyper.ai/29siB

效果示例:

图片

Demo 运行

1.进入 hyper.ai 首页后,选择「Qwen-Image-2512:更真实的人像与自然风光生成」,或进入「教程」页面选择。页面跳转后,点击「在线运行此教程」。

图片

图片

2.页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。

注:页面右上角支持切换语言,目前提供中文及英文两种语言,本教程文章以英文为例进行步骤展示。

图片

3.选择「NVIDIA GeForce RTX 5090-2」以及「PyTorch」镜像,按照需求选择「Pay As You Go(按量付费)」或「Daily Plan/Weekly Plan/Monthly Plan(包日/周/月」,点击「Continue job execution(继续执行)」。

HyperAI 为新用户准备了注册福利,仅需 1,即可获得20小时RTX5090算力(原价1,即可获得 20 小时 RTX 5090 算力(原价 7),资源永久有效。

图片

图片

4.等待分配资源,当状态变为「Running(运行中)」后,点击「Open Workspace」进入 Jupyter Workspace。

图片

效果演示

页面跳转后,点击左侧 README 页面,进入后点击上方 Run(运行)。

图片

图片

待运行完成,即可点击右侧 API 地址跳转至 demo 页面

图片

图片

以上就是 HyperAI超神经本期推荐的教程,欢迎大家前来体验!

教程链接:

go.hyper.ai/29siB