2025 年 6 月 6 日,字节跳动 Seed 团队正式发布图像编辑模型 SeedEdit 3.0。该模型可处理并生成 1K 以上高清图像,在精细且自然地处理编辑区域的同时,还能高保真地维持其他信息。尤其针对图像编辑“哪里改与哪里不改”的取舍,该模型表现出更佳的理解力和权衡力,可用率相应提高。
市面上与 SeedEdit 3.0 具备相似功能的还有:
-
OpenAI 率先推出的 GPT-Image-1 , 能够更好地理解和执行包含多个对象和复杂细节的提示词;
-
Google 发布的 Gemini 2.0 Flash Preview Image Generation,以其独特的多轮编辑范式和高率命中的提示词模板脱颖而出;
-
而 Flux Kontext Max 凭借惊人的细节表现和顶级的人物一致性能力吸引了众多用户的关注。
302.AI 目前已成功接入 SeedEdit 3.0 在内的多个图像编辑模型的 API,其实际表现力如何呢?我们在此对 SeedEdit 3.0、GPT-Image-1、 Gemini 2.0 Flash Preview Image Generation、Flux Kontext Max 四个模型进行了实测对比。
Ⅰ. SeedEdit 3.0 实测案例
1. 测评目标
- 编辑质量与真实感:评估各模型在图像编辑后的视觉效果,包括细节保留、人物色彩一致性、光影自然度以及是否存在伪影或失真。
- 指令理解与执行准确性:测试模型对文本或图像指令的理解能力,检查编辑结果是否准确反映用户意图。
2. 测评方法
各案例均使用统一的中文提示词和图片进行生成,且均取第一次生成结果,评测结果仅供参考。
- SeedEdit 3.0 使用 302.AI 平台 API 超市内的在线调试功能;
- GPT-Image-1 及 Flux Kontext Max 使用 302.AI 应用超市的应用: AI 图片创意站;
- Gemini 2.0 Flash Preview Image Generation 使用 302.AI 的聊天机器人。
4. 实测案例
案例 1:发丝发光
(1)提示词:太阳光把人物头发上的发丝照得发光
(2)生成效果:
(3)对比分析:
| 测评点 | SeedEdit 3.0 | GPT-Image-1 | Gemini 2.0 Flash Preview | Flux Kontext Max |
|---|---|---|---|---|
| 指令执行准确性 | ★★★★★ | ★★★★ | ★★★ | ★ |
| 人物一致性 | ★★★★★ | ★★ | ★★★ | ★★★★ |
| 光影表现 | ★★★★★ | ★★★ | ★★ | ★ |
简评:SeedEdit 3.0 呈现了断档级别的最佳 效果,在保持人物一致性的前提下,生成的光照柔和不生硬,高锐度的头发细节令人赞叹
案例 2:绘画转真实模特图
(1)提示词:请将图片转成颜色搭配合理的真人模特图
(2)生成效果:
(3)对比分析:
| 测评点 | SeedEdit 3.0 | GPT-Image-1 | Gemini 2.0 Flash Preview | Flux Kontext Max |
|---|---|---|---|---|
| 服装还原 | ★★★★ | ★★ | ★★★★ | ★★★★★ |
| 人物一致性 | ★★★ | ★★ | ★★★ | ★★★★★ |
| 画面美感 | ★★★★ | ★★★ | ★★ | ★★★★ |
简评:综合 表现 最好 的是 Flux Kontext Max,服装色彩搭配合理的同时面料质感最强。人物无论身材比例、面部五官在忠实于原画的前提下,拟真度最高,背景光影自然。SeedEdit 3.0 的美感在线,但拟真写实程度有提升空间。
案例 3:场景光影变换
(1)提示词:把场景变为白天
(2)生成效果:
(3)对比分析:
| 测评点 | SeedEdit 3.0 | GPT-Image-1 | Gemini 2.0 Flash Preview | Flux Kontext Max |
|---|---|---|---|---|
| 光源变化自然度 | ★★★★★ | ★★★★ | ★★ | ★★★ |
| 场景一致性 | ★★★★★ | ★★ | ★★★ | ★★★★ |
| 画面美感 | ★★★★★ | ★★★★★ | ★★ | ★★★ |
简评:SeedEdit 3.0 整体效果最佳,细节准确保留,光源照射合理,色调通透讨喜。GPT-Image-1 的场景一致性差,室内的部分物品发生了明显变化,如墙上挂饰,台灯样式;Gemini 2.0 Flash 户外的天色并不是典型的日间颜色;Flux 细节发生变化,如床头的台灯为关闭状态,但被子上仍有光照,整体色调暗淡。
案例 4:消除路人+改变动作
(1)提示词:戴帽子外的所有路人都消除,主体人物动作变换成看镜头比剪刀手
(2)生成效果:
(3)对比分析:
| 测评点 | SeedEdit 3.0 | GPT-Image-1 | Gemini 2.0 Flash Preview | Flux Kontext Max |
|---|---|---|---|---|
| 路人消除效果 | ★★★★★ | ★★★★ | ★ | ★★ |
| 动作变化效果 | ★★★★★ | ★★★★ | ★★★ | ★★ |
| 画面一致性 | ★★★★★ | ★★ | ★★★ | ★★★ |
简评:SeedEdit 3.0 轻松取胜:人物/画面风格一致性的前提下,能够准确消除所有路人,人物动作变化自然。Gemini 和 Flux 未完全消除路人,GPT-Image-1 的人物一致性问题仍是最大短板。
案例 5:复杂任务
(1)提示词:将广告牌上的“FREE BUS STOP BILL BORAD MOCKUP”改成“Discover the beauty of life.发现美”,并把文字黄色底色改成紫色,再给广告海报里的女性戴上墨镜
(2)生成效果:
(3)对比分析:
| 测评点 | SeedEdit 3.0 | GPT-Image-1 | Gemini 2.0 Flash Preview | Flux Kontext Max |
|---|---|---|---|---|
| 修改文字&排版 | ★★★★ | ★★★ | ★ | ★★ |
| 修改颜色 | ★★★★★ | ★★★★★ | ★★★★★ | ★★★★★ |
| 人物墨镜添加效果 | ★★ | ★★★ | ★★★ | ★★★ |
简评:仅 SeedEdit 3.0 中英文字生成准确,但文字排版美感最差,墨镜添加效果有明显突兀感;GPT-Image-1 中文文字生成有误;Gemini 未修改文案;Flux 未生成中文,墨镜镜片大小不一。整体来看这一组实测,都还未达到直接可用的质量
Ⅱ.实测结论
SeedEdit 3.0 在本次五则案例的测评中,在多个维度上均表现出色,尤其在保持人物一致性、细节修改、光影处理和场景风格统一方面都展示了超越海外竞品的实力。
具体而言,SeedEdit 3.0 能够高精度地保留如人物发梢级别的细节,光影过渡柔和自然,且在消除干扰元素(如路人)时,效果准确而自然,展现了其强大的场景理解和编辑能力。在文字生成方面,SeedEdit 3.0 能够准确生成中英文字,尽管在排版的美感上仍有提升空间,但这并不影响其在核心图像编辑功能上的领先地位。
综合而言,SeedEdit 3.0 在人物一致性、细节准确度和场景连贯性方面均表现出明显的优势,有效解决了竞品在这些方面存在的“场景一致性差”、“细节发生变化”以及“人物一致性问题”等短板。结合 0.05 $/次的使用成本,SeedEdit 3.0 的表现无疑是当下最具潜力和竞争力的图像编辑模型。