扣子(coze)高级实战-输入电影名,文案配音字幕全自动搞定

0 阅读9分钟

这个工作流的思路是

  • 影视解说类视频的核心是“文案+配音+画面”。
  • 传统做法是手动写稿、录音、剪辑,一条片子至少一两个小时。
  • 用扣子搭一个最小可行产品(MVP),把这三个环节串成自动化流水线:
  • 输入一个电影名大模型生成解说文案→TTS合成配音→AI生成封面图→官方视频剪辑工具把图片和音频合成最终视频。

img

为什么不用“剪映小助手”了

  • 剪映小助手(无论是51aigc还是其他版本)是一个第三方桌面软件,扣子和剪映之间没有官方API对接,这类工具随时可能停更、失效。
  • 扣子官方已经上线了视频剪辑工具插件,包含为视频添加字幕、音视频合成、视频拼接、音频和图片合成视频等功能。
  • 所有操作在扣子内部完成,不需要安装任何外部软件,也不需要剪映专业版配合。

最终效果:输入“《肖申克的救赎》”,工作流直接输出一个mp4视频文件URL,浏览器打开即可下载或预览。

1️⃣ 第一步:创建工作流并定义输入

🖱️ 操作解读:登录扣子(coze.cn)→左侧“资源库”→“工作流”→“创建工作流”,起名“影视解说MVP”。

🧩 配置开始节点:点击画布上的“开始”节点,定义输入变量:

  • movie_nameString,用户输入的电影名称,如“《肖申克的救赎》”。

img

2️⃣ 第二步:用大模型生成影视解说文案

🔍 操作解读:左侧“模型”分类拖出“大模型”节点,连在开始节点后面。

✍️ 提示词配置:点开大模型节点,粘贴以下提示词(一字不改),变量 {{开始节点.movie_name}} 用选择器绑定。

# 角色设定
你是一个拥有千万粉丝的抖音影视解说博主,风格犀利、口语化、善于埋钩子、制造悬念。

# 任务
请根据电影名称,生成一篇影视解说文案,篇幅适合40-60秒口播。

# 输入数据
电影名称:{{开始节点.movie_name}}

# 输出要求
请严格按照以下结构输出,不要加任何额外说明,不要使用代码块标记。

【开头3秒钩子】
一句话制造悬念或反差,让人必须往下看。

【剧情梗概】
用3-4句话讲清核心冲突和主要情节,语言口语化,多用短句。

【深度解读】
1-2句对人物、主题或个人感悟进行提炼。

【结尾互动】
用问题或号召性语句引导评论,例如:“你觉得他做得对吗?评论区告诉我。”

# 约束规则
- 所有内容必须基于电影真实情节,严禁编造。
- 全程用“你”“我”对话感,像是在跟朋友聊天。
- 禁止出现“大家好”“欢迎收看”等套话。
- 整篇文案要连贯,段落之间用空行分隔。

🔗 变量引用:在提示词里找到 {{开始节点.movie_name}},删掉手写文字,点击“添加变量”→“节点引用”→选择开始节点的 movie_name

img

3️⃣ 第三步:TTS语音合成(免费插件:语音合成火山版)

🔍 操作解读

  • 左侧“插件”搜索“语音合成火山版”,连接在大模型节点后面。
  • 这是扣子官方提供的免费TTS插件,日常使用完全足够。
  • 如需更高自然度和情绪表现力,可换用“语音合成(speech_synthesis)”付费版,插件参数和调用方式几乎一模一样。

img

🧩 配置TTS节点

  • speech_synthesis:根据音色和文本合成音频
  • text(必填):要合成音频的文本内容
  • app_id(必填):火山控制台个人app id
  • cluster(必填):火山服务集群
  • app_token(必填):火山控制台个人app token
  • speaker_id(必填):音色ID,默认为爽快思思/Skye。详细音色列表参考 【语音合成】插件使用说明, default value is 爽快思思/Skye
  • emotion(非必填):语音情感
  • language(非必填):语音语种,参考 【语音合成】插件使用说明
  • speed_ratio(非必填):范围是[0.2,3],默认为1,通常保留一位小数即可, default value is 1
  • emotion_scale(非必填):调用emotion设置情感参数后可使用emotion_scale进一步设置情绪值,范围1~5,不设置时默认值为4。

💡 关键:TTS节点会输出一个音频文件的URL,后续视频合成节点会用到。

img

4️⃣ 第四步:用AI生成一张封面图(免费插件:Doubao-图像生成(自接入版))

  • 🔍 操作解读:添加插件“Doubao-图像生成(自接入版)”,可与大模型节点并行连接,减少等待时间。如需更快生成速度和更丰富风格,可换用“Doubao-图像生成(gen_image)”付费版,插件参数完全一致。
  • 🧩 配置绘画节点参数
    • prompt(必填):例如“电影《肖申克的救赎》经典场景,高墙,雨中,男人张开双臂,电影海报风格”。支持中英文。
    • req_schedule_conf(必填):下拉选择模型配置。general_v20_9B_pe图文匹配度更好,general_v20_9B_rephraser美感更好,按需选择。
    • height(选填):图片高度,取值范围 [256, 768] 像素,建议填 768
    • width(选填):图片宽度,取值范围 [256, 768] 像素,建议填 432(竖屏比例)。
  • 📦 输出结果:节点输出图片URL,存放在 data.data.image_urls 嵌套字段里。

img

5️⃣ 第六步:官方视频剪辑工具——合成视频

这是最关键的步骤。

用扣子官方“视频剪辑工具”插件替代之前的外部剪映小助手,所有操作在扣子内完成,直接输出最终视频文件。

视频剪辑工具插件包含12个工具,本教程用到其中三个:compile_image_audioaudio_to_subtitleadd_subtitles

6.1 音频和图片合成视频(compile_image_audio)

🔍 操作解读:添加“视频剪辑工具”插件,选择 compile_image_audio 工具。它的作用是把一张图片和一段音频合成为一个视频文件。

🧩 配置参数

  • image_url:引用代码节点输出的 image_url
  • audio_url:引用TTS语音合成节点输出的音频URL。

📦 输出:该节点返回一个合成后的视频URL(无字幕版本)。

img

6.2 语音自动转字幕(audio_to_subtitle)⭐ 重点

🔍 操作解读:在 compile_image_audio 节点后,添加“视频剪辑工具”插件,这次选择 audio_to_subtitle 工具。它的作用是将视频中的语音自动转写为字幕文件(SRT格式),省去手动填写 text_list 的麻烦。本教程首选这种方式,彻底告别手动对时间轴。

🧩 配置参数

  • source:引用上一步 compile_image_audio 节点输出的视频URL。插件会自动识别视频中的语音并生成带时间戳的字幕文件。

📦 输出:该节点返回一个字幕文件URL(SRT格式),后续直接用于 add_subtitlessubtitle_url 参数。

img

⚠️ 备选方案

  • 如果 audio_to_subtitle 工具在你的版本中不可用,或需要更精细的字幕控制(如特定位置、字体样式),可以使用 text_list 方案。
  • 方法是在此步骤用代码节点将大模型文案拆成字幕片段,手动组装成 text_list 格式,然后跳过 6.2 直接进入 6.3,将 text_list 传入 add_subtitles 节点。

6.3 为视频添加字幕(add_subtitles)

🔍 操作解读:在 audio_to_subtitle 节点后,再次添加“视频剪辑工具”插件,这次选择 add_subtitles 工具。它会把字幕文件叠加到视频画面上。

🧩 配置参数

  • video_url:引用步骤 6.1 compile_image_audio 节点输出的视频URL。
  • subtitle_url:引用步骤 6.2 audio_to_subtitle 节点输出的字幕文件URL。
  • subtitle_config(选填):字幕样式配置。如需自定义字幕位置和样式,可按以下格式填入:
{
  "font_size": 36,
  "font_type": "sys_sans",
  "font_color": "#FFFFFFFF",
  "border_color": "#FF000000",
  "border_width": 2,
  "font_pos_config": {
    "pos_x": "50%",
    "pos_y": "90%",
    "width": "80%",
    "height": "10%"
  }
}

⚠️ 重要提示font_pos_config 中各项坐标值(pos_x, pos_y, width, height)必须使用百分比字符串(如 "50%""90%"),不要使用具体像素值(如 "800"),否则字幕会被“挤”出画面,且插件不报错,导致生成的视频无字幕显示。

  • 📦 输出:该节点返回最终的带字幕视频URL。

img

6️⃣ 第七步:配置结束节点并测试

🔗 操作解读

  1. add_subtitles 节点连接到“结束”节点。
  2. 点开结束节点,定义输出变量:变量名:url,变量类型:String,引用 add_subtitles 节点输出的视频URL。

🧪 试运行测试

  1. 点击“试运行”,输入电影名“《肖申克的救赎》”。
  2. 等待流程跑完,观察节点状态是否全部变绿。
  3. 复制结束节点输出的 video_url,粘贴到浏览器打开,确认视频可正常播放。

🚀 发布:测试通过后点“发布”,这个工作流就可以被智能体或 API 调用。

img

⚠️ 踩坑指南

  • 不要相信大模型给你生成的参数配置之类的,官方插件上都有【参数】【示例】。我遇到的坑,根据大模型把字幕直接写成数字,死活出不来,后来仔细仔细的看完插件参数与示例,才发现是百分比
  "font_pos_config": {
    "pos_x": "50%",
    "pos_y": "90%",
    "width": "80%",
    "height": "10%"
  }
  • 刚开始没有加6.2章节,直接用了 text_list 这个参数,太麻烦了,你要为每一段的字幕设置start_time,end_time 得不偿失,这样就失去了自动化的意义

img

  • 大模型告诉我要加代码节点,完全扯淡,我做的时候直接去掉了;只有下游的输入参数不符合要求时候才需要代码节点去处理

🚀 后续优化方向

这个MVP只是起点,你还可以在此基础上逐步叠加:

  • 分镜画面:把大模型文案按分镜拆分,每一句配一张AI生成的插图,用多个绘画节点批量出图后,循环拼接为多画面视频。
  • 数字人出镜:加入“蝉镜”插件,生成数字人口播视频,替换静态封面图。
  • 批量生产:用定时触发器+电影列表,每天自动生成N条解说视频,人工挑选后发布。

💡 成本与升级建议

  • 本教程全部使用扣子官方免费插件,零成本跑通全流程。
  • 当需要更高质量的配音时,可将第三步替换为“语音合成(speech_synthesis)”;
  • 需要更精美的封面图时,可将第四步替换为“Doubao-图像生成(gen_image)”;
  • 所有付费版插件参数与免费版基本一致,只需在插件市场搜索名称切换节点即可,其他步骤无需改动。
  • 视频剪辑工具本身有免费额度,日常测试足够,大量生产时注意控制分辨率以节省积分。

现在,你已经拥有了一个基于完全官方免费插件、不依赖任何外部软件的影视解说视频生成MVP。输入电影名,直接出片。