前言
之前对AIGC的关注并不多,总感觉它们更像是一些玩具,好看但却没法直接带来效率的提升。 随着今年大模型业务的接洽,感觉AIGC和客户侧其实更靠近,AI生成图片、视频的过程,可以更加直观地让客户体会到AI对效率的提升。这对于初次深入了解AI的客户来说,是一个非常有效的方式,十分利于后续业务的推进。
所以,下半年,我也开始研究AIGC的相关内容,期望通过AIGC让更多人了解到AI的价值。
目的
本文使用不同的文生图平台(通义万相、即梦、可灵)对相同提示词进行图片生成,方便大家对生成结果进行直观对比。
为了控制变量,本文限制如下,不代表测试平台的最佳生成效果。
- 提示词通过Kimi辅助生成
- 为了方便检验效果,提示词不会过长
- 提示词未进行任何优化
- 为了方便对比,3个平台的生图模型都采用最新模型。
免费模式
三个平台都可以免费使用,账号会拥有一定的免费额度。
通义万相:额度名称“灵感值”,日常每天签到可以领取50额度,一次生成4张图片消耗1额度。
即梦:额度名称“积分”,每日自动分配66积分,一次生成4张图片消耗1额度。
可灵:额度名称“灵感值”,一个月366额度,一次生成4张图片消耗4额度。
购买的话:
- 通义万相暂时没有开放购买,但是可以通过反馈、投稿赚取。
- 即梦和可灵基本都是1元人民币购买10额度。
生成速度
直观感受:
- 即梦最快
- 通义万相次之
- 快手经常出现需要排队的情况,生成可能不慢,但是整体时间过久。
实测
自然风光
场景描述: 测试模型生成自然风景图片的能力,关注写实、倒影、细节。
提示词: "一片宁静的山谷,山谷中有一片清澈的湖泊,湖面上倒映着山峦和天空的美景,湖边长满了野花,蝴蝶在花丛中翩翩起舞。"
通义万相:
即梦:
可灵:
城市建筑
场景描述: 评估模型在生成人造景观方面的表现,关注高楼大厦、街道以及夜景。
提示词: "现代都市夜景,摩天大楼林立,霓虹闪烁,街道车水马龙,远处天际线清晰。"
通义万相:
即梦:
可灵:
人物生成
场景描述: 测试模型在生成人物形象方面的能力,关注衣着、动作。
提示词: "一位古代侠客,身着现代学生校服,摆出一个野马分鬃的动作"
通义万相:
即梦:
可灵:
艺术创作
场景描述: 测试模型模仿特定艺术风格的能力,具体以梵高的《向日葵》作品为模板。
提示词: "一幅按照文森特·梵高《向日葵》风格绘制的作品,主体为玫瑰花。"
原图:
通义万相:
即梦:
可灵:
科幻想象
场景描述: 探索模型在想象的潜力。
提示词: "展示一个与地球完全不同的、奇特的外星文明,包含生物、建筑、动植物、装备。"
通义万相:
即梦:
可灵:
包含中文字体的图片生成
场景描述: 验证模型能否在图像中正确地生成中文文本。
提示词: "一个写着“鹅鹅鹅,曲项向天歌”的书法作品。"
通义万相:
即梦:
可灵:
文章上下文生成配图
场景描述: 根据提供的文章内容生成相应的插图,测试模型理解并可视化文字信息的能力。
提示词: "根据以下诗句生成插图:千山鸟飞绝,万径人踪灭"
通义万相:
即梦:
可灵:
总结
本文通过多种文生图场景的创作,对三款文生图模型进行了直观对比,希望能够让大家对各个平台有所了解,方便以后根据需要挑选最契合的平台。
同时,为了避免大家对文生图模型失去信心,之后会专门整理一篇三个平台优秀作品的案例分享。