超越 4K!Sana 高效生成影视级超高分辨率图像

137 阅读1分钟

Sana 是 2025 年 1 月发布,由 NVIDIA 、麻省理工学院、清华大学共同领导的项目。 Sana 是一个文本到图像的框架,可以有效地生成高达 4096 × 4096 分辨率的图像。 Sana 可以以非常快的速度合成高分辨率、高质量的图像,具有很强的文本-图像对齐能力。相关论文成果为「SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers」,已被 ICLR 2025 接受。

教程链接:go.openbayes.com/5wt1r

使用云平台: OpenBayes

openbayes.com/console/sig…

首先点击「公共教程」,在公共教程中找到「Sana 高分辨率图像合成 」,单击打开。

页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。

平台会默认选配好原教程所使用的算力资源、镜像版本,不需要再进行手动选择。目前平台计费方式已经更新,大家可以按照需求选择「按量付费」或「包日/周/月」。点击「继续执行」,等待分配资源。

数据和代码同步完成,带容器状态显示为「运行中」后,打开 API 地址。

待页面跳转后,即可使用模型。

首先,在「Total inference runs」输入 prompt,例如「A cyberpunk-style cat with mechanical limbs and neon lights」,输入完成后点击「Run」,可以看到它根据提示词很快的生成了一只具有机械义肢和霓虹灯光效果的赛博朋克风格小狗。并且,图像非常清晰,毛发、眼睛这些细节也处理的非常好。