一、为什么需要这条工作流
做过电商的朋友都知道,产品详情页的展示视频是转化率的命门。一条好的模特展示视频,能让转化率从1.5%飙升到4%以上。但问题来了——请模特、租场地、找摄影师、后期剪辑,一条视频动辄几千块,500个SKU就是几十万的投入。更别提拍摄周期动不动就是几周。
有没有一种方式,只上传一张产品图,就能自动生成模特展示图和配套视频?
答案是扣子工作流 + Seedance 2.0。这条工作流把"产品图→AI模特展示图→多角度图→九宫格分镜→Seedance 2.0视频"串联成全自动化流程,从产品图到成片视频,全程零人工介入。
二、工作流整体架构
整条工作流的核心思路:上传一张产品图,AI自动生成模特展示图和配套视频。流程分为三大阶段:
阶段一:图片生成(步骤1-3)— 从产品图生成正面模特图 + 10张多角度图
阶段二:分镜与视频(步骤4-7)— 生成九宫格分镜 → Seedance 2.0视频
阶段三:结果轮询(步骤8)— 异步查询视频生成状态,直到拿到成片
开始节点需要3个输入参数:
表格
参数名
类型
说明
key
string
视频生成API密钥
changjing
string
模特场景描述(如"户外草坪阳光明媚")
chanpingtu
image
产品图片
三、实战搭建:8步从产品图到成片
3.1 步骤1:上传产品图片及定义模特场景
在开始节点中配置三个变量:key(API密钥)、changjing(场景描述)、chanpingtu(产品图)。用户只需上传一张产品实物图,并用自然语言描述想要的模特场景即可。
3.2 步骤2:生成正面人物图片及10张不同角度的图片提示词
这一步使用大模型节点,核心任务有两个:
- 根据产品图和场景描述,生成正面模特展示图的提示词
- 同时生成10张不同角度(侧面、背面、45度角等)的图片提示词
节点类型:大模型节点
输入:changjing(场景描述)、chanpingtu(产品图)
输出:正面图片提示词 + 10张多角度图片提示词
提示词设计的要点:
- 正面图需要包含产品与模特的关联描述(如"模特手持产品微笑展示")
- 多角度图需要明确每个角度的视角方向和光线条件
- 保持风格一致性,所有图片使用相同的色调和背景风格
3.3 步骤3:根据提示词生成正面图片及10张不同角度图片
这一步包含几个子节点的串联,是阶段一最复杂的部分。
图片格式转换节点:将产品图转换为工作流可处理的格式
节点类型:插件节点(str_to_list)
输入:chanpingtu(原始产品图)
输出:格式化后的图片数据列表
生成正面图片节点:使用图像生成模型,根据正面提示词生成模特+产品展示图
图片聚合节点:将正面图和产品图聚合,作为后续节点的输入
批量生成10张不同角度图片:这是阶段一的核心难点。10张图的生成需要用到批处理机制,并且加入了质量保障流程:
批处理体内节点流程:
生成9张图片 → 提示词优化 → 再次生图 → 选择器_1 → 变量聚合
这里的提示词优化 + 再次生图 + 选择器构成了一个质量自检闭环:
- 先用原始提示词生成图片
- 如果生成效果不理想,通过提示词优化节点自动调整提示词
- 用优化后的提示词再次生图
- 选择器节点判断哪次生成效果更好,保留较优结果
- 变量聚合节点将所有图片汇总输出
这个闭环设计的巧妙之处在于:不需要人工介入,工作流自己就能完成"生成→评估→优化→再生成"的迭代。对于批量生图场景,这种自检机制能避免因个别提示词偏差导致大量废图。
3.4 步骤4:根据正面图片生成九宫格分镜图片提示词
有了正面模特图和多角度图片后,下一步是规划视频分镜。这里使用大模型节点(豆包·2.0 pro),根据正面图片和场景信息生成九宫格分镜的提示词。
节点类型:大模型节点
模型:豆包·2.0 pro
输入:正面图片URL、changjing(场景描述)
输出:9个分镜画面的文字提示词
为什么用九宫格分镜?因为电商展示视频通常需要多个角度和场景切换:
- 正面全身展示
- 产品细节特写
- 模特侧面展示
- 产品使用场景
- 背面展示
- 动态行走展示
- 产品与场景融合
- 面部特写
- 品牌收尾画面
九宫格分镜的好处是一次生成9个连贯的分镜画面,保证视觉风格统一、镜头语言连贯,为后续视频生成提供稳定的视觉参考。
3.5 步骤5:根据九宫格图片提示词生成九宫格分镜图片
使用图像生成节点,根据上一步生成的9个分镜提示词,批量生成9张分镜图片。
3.6 步骤6:参照九宫格分镜图片生成视频提示词
这一步是连接图片和视频的桥梁。使用大模型节点,根据九宫格分镜图片的内容,生成适合Seedance 2.0模型的视频提示词。
节点类型:大模型节点
模型:豆包·2.0 pro
输入:九宫格分镜图片URL、changjing(场景)
输出:output(视频提示词)、reasoning_content(推理过程)
视频提示词的关键要素:
- 画面内容描述(模特动作、产品展示方式)
- 镜头运动方式(推、拉、摇、移)
- 场景氛围(光线、色调、情绪)
- 时长分配(每个分镜的时长建议)
3.7 步骤7:根据视频提示词使用Seedance 2.0生成视频
这是整条工作流的核心节点,调用Seedance 2.0模型生成视频。
{
"node": "Seedance 2.0视频生成",
"input": {
"key": "引用开始节点的API密钥",
"prompt": "引用步骤6生成的视频提示词",
"duration": 10,
"model": "doubao-seedance-pro"
},
"output": {
"data": "任务ID,用于后续轮询",
"message": "状态信息"
}
}
Seedance 2.0是字节跳动推出的视频生成模型,支持文生视频、图生视频、多镜头叙事和可控时长(3-12秒)。
注意:Seedance 2.0的视频生成是异步的,提交任务后会返回一个任务ID,需要通过轮询机制查询生成状态。
3.8 步骤8:异步轮询视频生成状态
视频生成需要一定时间(通常2-5分钟),工作流通过循环+选择器+定时器的组合实现异步轮询:
循环体节点流程:
查询任务 → 选择器 → 定时器 / 终止循环
// 轮询逻辑伪代码
const taskId = seedanceOutput.data;
while (true) {
const taskInfo = await queryTask(taskId);
if (taskInfo.url !== null && taskInfo.url !== "") {
// 视频生成完成,退出循环
break;
}
// 等待60秒后再次查询
await sleep(60);
}
循环节点:控制整体轮询逻辑,中间变量var_id记录任务ID
查询任务节点:每次循环调用task_info接口,查询视频生成状态
选择器节点:判断视频是否生成完成
判断条件:task_info.url 是否为空
- 如果为空 → 视频还在生成中 → 进入定时器等待
- 如果不为空 → 视频生成完成 → 终止循环
定时器节点:控制轮询间隔(建议60秒),避免频繁请求API触发限流
去空值处理:循环结束后,用代码块节点(list_sli_trim)过滤空数据,输出有效视频URL
四、核心节点配置汇总
表1:工作流核心节点配置一览
表格
序号
节点名称
节点类型
核心作用
关键配置
1
开始
开始节点
接收产品图、场景、密钥
key/changjing/chanpingtu
2
生成正面和不同角度提示词
大模型
生成11张图的提示词
场景+产品图作为输入
3
图片格式转换
插件(str_to_list)
产品图格式转换
引用开始节点的产品图
4
生成正面图片
图像生成
生成正面模特展示图
引用正面提示词
5
图片聚合
变量聚合
合并正面图和产品图
两个图片源聚合
6
批量生成多角度图片
批处理
批量生成+质量自检
含提示词优化+选择器
7
生成九宫格分镜提示词
大模型(豆包2.0 pro)
规划9个分镜画面
正面图+场景作为输入
8
生成九宫格分镜图
图像生成
生成9张分镜图
引用分镜提示词
9
视频提示词生成
大模型(豆包2.0 pro)
生成Seedance视频提示词
分镜图+场景作为输入
10
Seedance 2.0生成视频
视频生成
提交视频生成任务
key+prompt+duration
11
循环查询
循环
轮询视频生成状态
var_id记录任务ID
12
查询任务
插件(task_infos)
查询视频状态
id引用循环节点
13
选择器
IF选择器
判断视频是否完成
url是否为空
14
定时器
time_wait
控制轮询间隔
seconds=60
15
去空值
代码块(list_sli_trim)
过滤无效视频数据
引用循环输出
16
结束
结束节点
输出有效视频URL
引用去空值结果
五、搭建注意事项与进阶技巧
5.1 提示词质量决定输出质量
整条工作流中,步骤2和步骤6的提示词生成是质量的关键。建议在提示词模板中明确以下要素:
- 模特外貌特征(性别、发型、服装风格)
- 产品与模特的互动方式(手持、穿戴、摆放)
- 场景氛围(室内/室外、光线、色调)
- 视角和构图(全身/半身/特写、俯拍/仰拍)
5.2 批量生图的质量自检
批量生成10张不同角度图片时,难免有个别图片质量不佳。工作流中的"提示词优化→再次生图→选择器"三节点组合,可以有效解决这个问题。如果你的场景比较简单,也可以去掉这个闭环,直接用原始提示词生成,节省Token消耗。
5.3 轮询间隔的选择
定时器的等待时间建议设为60秒。设置太短(如10秒)会频繁请求API,可能触发限流。设置太长(如5分钟)会导致工作流执行时间过长,影响用户体验。60秒是一个兼顾效率和稳定性的选择。
5.4 异步视频生成的超时处理
如果Seedance 2.0的视频生成时间较长(超过5分钟),建议在循环中增加一个最大循环次数限制,避免无限等待:
# 超时保护伪代码
MAX_RETRY = 10 # 最多轮询10次,约10分钟
retry_count = 0
while retry_count < MAX_RETRY:
task_info = query_task(task_id)
if task_info.url:
return task_info.url # 生成完成
if retry_count >= MAX_RETRY - 1:
return {"error": "视频生成超时,请稍后重试"}
sleep(60)
retry_count += 1
5.5 九宫格分镜的灵活调整
九宫格分镜不是固定的9个画面,你可以根据产品类型调整分镜数量和内容。比如:
- 服装类:正面→侧面→背面→细节→穿搭场景(5-6个分镜)
- 美妆类:产品特写→使用场景→对比效果→品牌收尾(4-5个分镜)
- 数码类:产品全貌→功能展示→使用场景→细节特写(5-6个分镜)
六、总结
这条工作流实现了从产品图到电商展示视频的全自动化,核心亮点有三个:
- 多阶段图片生成:产品图→正面模特图→多角度图→九宫格分镜图,层层递进,保证视觉一致性
- 批量生图质量自检:提示词优化+选择器的闭环设计,无需人工介入即可保证生图质量
- 异步视频轮询机制:循环+选择器+定时器的组合,优雅地处理Seedance 2.0的异步生成
对于电商运营者来说,这条工作流可以把"请模特拍展示视频"这件事从数千元、数天周期,压缩到几毛钱、几分钟完成。当然,AI生成的视频在细节上还无法完全替代实拍,但对于产品详情页、社交媒体推广等场景,已经足够使用。
建议先从简单的场景(如纯色背景的产品展示)开始测试,逐步增加场景复杂度和分镜数量,积累提示词调优经验后再挑战更复杂的电商视频制作。
全网搜索「米核AI易山」,获取更多扣子工作流实战案例和模板。