生图模型PK - 万相、即梦、可灵对比体验

832 阅读4分钟

前言

之前对AIGC的关注并不多,总感觉它们更像是一些玩具,好看但却没法直接带来效率的提升。 随着今年大模型业务的接洽,感觉AIGC和客户侧其实更靠近,AI生成图片、视频的过程,可以更加直观地让客户体会到AI对效率的提升。这对于初次深入了解AI的客户来说,是一个非常有效的方式,十分利于后续业务的推进。

所以,下半年,我也开始研究AIGC的相关内容,期望通过AIGC让更多人了解到AI的价值。

目的

本文使用不同的文生图平台(通义万相、即梦、可灵)对相同提示词进行图片生成,方便大家对生成结果进行直观对比。

为了控制变量,本文限制如下,不代表测试平台的最佳生成效果。

  • 提示词通过Kimi辅助生成
  • 为了方便检验效果,提示词不会过长
  • 提示词未进行任何优化
  • 为了方便对比,3个平台的生图模型都采用最新模型。

免费模式

三个平台都可以免费使用,账号会拥有一定的免费额度。

通义万相:额度名称“灵感值”,日常每天签到可以领取50额度,一次生成4张图片消耗1额度。

20250121212503

即梦:额度名称“积分”,每日自动分配66积分,一次生成4张图片消耗1额度。

可灵:额度名称“灵感值”,一个月366额度,一次生成4张图片消耗4额度。

20250120232513

购买的话:

  • 通义万相暂时没有开放购买,但是可以通过反馈、投稿赚取。
  • 即梦和可灵基本都是1元人民币购买10额度。

生成速度

直观感受:

  • 即梦最快
  • 通义万相次之
  • 快手经常出现需要排队的情况,生成可能不慢,但是整体时间过久。

实测

自然风光

场景描述: 测试模型生成自然风景图片的能力,关注写实、倒影、细节。

提示词: "一片宁静的山谷,山谷中有一片清澈的湖泊,湖面上倒映着山峦和天空的美景,湖边长满了野花,蝴蝶在花丛中翩翩起舞。"

通义万相

20250121220121

即梦

20250121220112

可灵

20250121230333

城市建筑

场景描述: 评估模型在生成人造景观方面的表现,关注高楼大厦、街道以及夜景。

提示词: "现代都市夜景,摩天大楼林立,霓虹闪烁,街道车水马龙,远处天际线清晰。"

通义万相

20250121220522

即梦

20250121220507

可灵

20250121230308

人物生成

场景描述: 测试模型在生成人物形象方面的能力,关注衣着、动作。

提示词: "一位古代侠客,身着现代学生校服,摆出一个野马分鬃的动作"

通义万相

20250121222623

即梦

20250121222633

可灵

20250121230200

艺术创作

场景描述: 测试模型模仿特定艺术风格的能力,具体以梵高的《向日葵》作品为模板。

提示词: "一幅按照文森特·梵高《向日葵》风格绘制的作品,主体为玫瑰花。"

原图:

20250121222432

通义万相

20250121221733

即梦

20250121221826

可灵

20250121230059

科幻想象

场景描述: 探索模型在想象的潜力。

提示词: "展示一个与地球完全不同的、奇特的外星文明,包含生物、建筑、动植物、装备。"

通义万相

20250121223423

即梦

20250121223357

可灵

20250121223345

包含中文字体的图片生成

场景描述: 验证模型能否在图像中正确地生成中文文本。

提示词: "一个写着“鹅鹅鹅,曲项向天歌”的书法作品。"

通义万相

20250121223826

即梦

20250121223835

可灵

20250121225945

文章上下文生成配图

场景描述: 根据提供的文章内容生成相应的插图,测试模型理解并可视化文字信息的能力。

提示词: "根据以下诗句生成插图:千山鸟飞绝,万径人踪灭"

通义万相

20250121225213

即梦

20250121225226

可灵

20250121225919

总结

本文通过多种文生图场景的创作,对三款文生图模型进行了直观对比,希望能够让大家对各个平台有所了解,方便以后根据需要挑选最契合的平台。

同时,为了避免大家对文生图模型失去信心,之后会专门整理一篇三个平台优秀作品的案例分享。