扣子（coze）高级实战-输入电影名，文案配音字幕全自动搞定这个工作流的思路是：影视解说类视频的核心是“文案+配音+画

这个工作流的思路是：

影视解说类视频的核心是“文案+配音+画面”。
传统做法是手动写稿、录音、剪辑，一条片子至少一两个小时。
用扣子搭一个最小可行产品（MVP），把这三个环节串成自动化流水线：
输入一个电影名，大模型生成解说文案→TTS合成配音→AI生成封面图→官方视频剪辑工具把图片和音频合成最终视频。

为什么不用“剪映小助手”了：

剪映小助手（无论是51aigc还是其他版本）是一个第三方桌面软件，扣子和剪映之间没有官方API对接，这类工具随时可能停更、失效。
扣子官方已经上线了视频剪辑工具插件，包含为视频添加字幕、音视频合成、视频拼接、音频和图片合成视频等功能。
所有操作在扣子内部完成，不需要安装任何外部软件，也不需要剪映专业版配合。

最终效果：输入“《肖申克的救赎》”，工作流直接输出一个mp4视频文件URL，浏览器打开即可下载或预览。

1️⃣ 第一步：创建工作流并定义输入

🖱️ 操作解读：登录扣子（coze.cn）→左侧“资源库”→“工作流”→“创建工作流”，起名“影视解说MVP”。

🧩 配置开始节点：点击画布上的“开始”节点，定义输入变量：

movie_name：String，用户输入的电影名称，如“《肖申克的救赎》”。

2️⃣ 第二步：用大模型生成影视解说文案

🔍 操作解读：左侧“模型”分类拖出“大模型”节点，连在开始节点后面。

✍️ 提示词配置：点开大模型节点，粘贴以下提示词（一字不改），变量 {{开始节点.movie_name}} 用选择器绑定。

# 角色设定
你是一个拥有千万粉丝的抖音影视解说博主，风格犀利、口语化、善于埋钩子、制造悬念。

# 任务
请根据电影名称，生成一篇影视解说文案，篇幅适合40-60秒口播。

# 输入数据
电影名称：{{开始节点.movie_name}}

# 输出要求
请严格按照以下结构输出，不要加任何额外说明，不要使用代码块标记。

【开头3秒钩子】
一句话制造悬念或反差，让人必须往下看。

【剧情梗概】
用3-4句话讲清核心冲突和主要情节，语言口语化，多用短句。

【深度解读】
1-2句对人物、主题或个人感悟进行提炼。

【结尾互动】
用问题或号召性语句引导评论，例如：“你觉得他做得对吗？评论区告诉我。”

# 约束规则
- 所有内容必须基于电影真实情节，严禁编造。
- 全程用“你”“我”对话感，像是在跟朋友聊天。
- 禁止出现“大家好”“欢迎收看”等套话。
- 整篇文案要连贯，段落之间用空行分隔。

🔗 变量引用：在提示词里找到 {{开始节点.movie_name}}，删掉手写文字，点击“添加变量”→“节点引用”→选择开始节点的 movie_name。

3️⃣ 第三步：TTS语音合成（免费插件：语音合成火山版）

🔍 操作解读：

左侧“插件”搜索“语音合成火山版”，连接在大模型节点后面。
这是扣子官方提供的免费TTS插件，日常使用完全足够。
如需更高自然度和情绪表现力，可换用“语音合成（speech_synthesis）”付费版，插件参数和调用方式几乎一模一样。

🧩 配置TTS节点：

speech_synthesis：根据音色和文本合成音频
text（必填）：要合成音频的文本内容
app_id（必填）：火山控制台个人app id
cluster（必填）：火山服务集群
app_token（必填）：火山控制台个人app token
speaker_id（必填）：音色ID，默认为爽快思思/Skye。详细音色列表参考【语音合成】插件使用说明, default value is 爽快思思/Skye
emotion（非必填）：语音情感
language（非必填）：语音语种，参考【语音合成】插件使用说明
speed_ratio（非必填）：范围是[0.2,3]，默认为1，通常保留一位小数即可, default value is 1
emotion_scale（非必填）：调用emotion设置情感参数后可使用emotion_scale进一步设置情绪值，范围1~5，不设置时默认值为4。

💡 关键：TTS节点会输出一个音频文件的URL，后续视频合成节点会用到。

4️⃣ 第四步：用AI生成一张封面图（免费插件：Doubao-图像生成（自接入版））

🔍 操作解读：添加插件“Doubao-图像生成（自接入版）”，可与大模型节点并行连接，减少等待时间。如需更快生成速度和更丰富风格，可换用“Doubao-图像生成（gen_image）”付费版，插件参数完全一致。
🧩 配置绘画节点参数：
- prompt（必填）：例如“电影《肖申克的救赎》经典场景，高墙，雨中，男人张开双臂，电影海报风格”。支持中英文。
- req_schedule_conf（必填）：下拉选择模型配置。general_v20_9B_pe图文匹配度更好，general_v20_9B_rephraser美感更好，按需选择。
- height（选填）：图片高度，取值范围 [256, 768] 像素，建议填 768。
- width（选填）：图片宽度，取值范围 [256, 768] 像素，建议填 432（竖屏比例）。
📦 输出结果：节点输出图片URL，存放在 data.data.image_urls 嵌套字段里。

5️⃣ 第六步：官方视频剪辑工具——合成视频

这是最关键的步骤。

用扣子官方“视频剪辑工具”插件替代之前的外部剪映小助手，所有操作在扣子内完成，直接输出最终视频文件。

视频剪辑工具插件包含12个工具，本教程用到其中三个：compile_image_audio、audio_to_subtitle、add_subtitles

6.1 音频和图片合成视频（compile_image_audio）

🔍 操作解读：添加“视频剪辑工具”插件，选择 compile_image_audio 工具。它的作用是把一张图片和一段音频合成为一个视频文件。

🧩 配置参数：

image_url：引用代码节点输出的 image_url。
audio_url：引用TTS语音合成节点输出的音频URL。

📦 输出：该节点返回一个合成后的视频URL（无字幕版本）。

6.2 语音自动转字幕（audio_to_subtitle）⭐ 重点

🔍 操作解读：在 compile_image_audio 节点后，添加“视频剪辑工具”插件，这次选择 audio_to_subtitle 工具。它的作用是将视频中的语音自动转写为字幕文件（SRT格式），省去手动填写 text_list 的麻烦。本教程首选这种方式，彻底告别手动对时间轴。

🧩 配置参数：

source：引用上一步 compile_image_audio 节点输出的视频URL。插件会自动识别视频中的语音并生成带时间戳的字幕文件。

📦 输出：该节点返回一个字幕文件URL（SRT格式），后续直接用于 add_subtitles 的 subtitle_url 参数。

⚠️ 备选方案：

如果 audio_to_subtitle 工具在你的版本中不可用，或需要更精细的字幕控制（如特定位置、字体样式），可以使用 text_list 方案。

方法是在此步骤用代码节点将大模型文案拆成字幕片段，手动组装成 text_list 格式，然后跳过 6.2 直接进入 6.3，将 text_list 传入 add_subtitles 节点。

6.3 为视频添加字幕（add_subtitles）

🔍 操作解读：在 audio_to_subtitle 节点后，再次添加“视频剪辑工具”插件，这次选择 add_subtitles 工具。它会把字幕文件叠加到视频画面上。

🧩 配置参数：

video_url：引用步骤 6.1 compile_image_audio 节点输出的视频URL。
subtitle_url：引用步骤 6.2 audio_to_subtitle 节点输出的字幕文件URL。
subtitle_config（选填）：字幕样式配置。如需自定义字幕位置和样式，可按以下格式填入：

{
  "font_size": 36,
  "font_type": "sys_sans",
  "font_color": "#FFFFFFFF",
  "border_color": "#FF000000",
  "border_width": 2,
  "font_pos_config": {
    "pos_x": "50%",
    "pos_y": "90%",
    "width": "80%",
    "height": "10%"
  }
}

⚠️ 重要提示：font_pos_config 中各项坐标值（pos_x, pos_y, width, height）必须使用百分比字符串（如 "50%"、"90%"），不要使用具体像素值（如 "800"），否则字幕会被“挤”出画面，且插件不报错，导致生成的视频无字幕显示。

📦 输出：该节点返回最终的带字幕视频URL。

6️⃣ 第七步：配置结束节点并测试

🔗 操作解读：

将 add_subtitles 节点连接到“结束”节点。
点开结束节点，定义输出变量：变量名：url，变量类型：String，引用 add_subtitles 节点输出的视频URL。

🧪 试运行测试：

点击“试运行”，输入电影名“《肖申克的救赎》”。
等待流程跑完，观察节点状态是否全部变绿。
复制结束节点输出的 video_url，粘贴到浏览器打开，确认视频可正常播放。

🚀 发布：测试通过后点“发布”，这个工作流就可以被智能体或 API 调用。

⚠️ 踩坑指南

不要相信大模型给你生成的参数配置之类的，官方插件上都有【参数】【示例】。我遇到的坑，根据大模型把字幕直接写成数字，死活出不来，后来仔细仔细的看完插件参数与示例，才发现是百分比

  "font_pos_config": {
    "pos_x": "50%",
    "pos_y": "90%",
    "width": "80%",
    "height": "10%"
  }

刚开始没有加6.2章节，直接用了 text_list 这个参数，太麻烦了，你要为每一段的字幕设置start_time,end_time 得不偿失，这样就失去了自动化的意义

大模型告诉我要加代码节点，完全扯淡，我做的时候直接去掉了；只有下游的输入参数不符合要求时候才需要代码节点去处理

🚀 后续优化方向

这个MVP只是起点，你还可以在此基础上逐步叠加：

分镜画面：把大模型文案按分镜拆分，每一句配一张AI生成的插图，用多个绘画节点批量出图后，循环拼接为多画面视频。
数字人出镜：加入“蝉镜”插件，生成数字人口播视频，替换静态封面图。
批量生产：用定时触发器+电影列表，每天自动生成N条解说视频，人工挑选后发布。

💡 成本与升级建议：

本教程全部使用扣子官方免费插件，零成本跑通全流程。

当需要更高质量的配音时，可将第三步替换为“语音合成（speech_synthesis）”；

需要更精美的封面图时，可将第四步替换为“Doubao-图像生成（gen_image）”；

所有付费版插件参数与免费版基本一致，只需在插件市场搜索名称切换节点即可，其他步骤无需改动。

视频剪辑工具本身有免费额度，日常测试足够，大量生产时注意控制分辨率以节省积分。

现在，你已经拥有了一个基于完全官方免费插件、不依赖任何外部软件的影视解说视频生成MVP。输入电影名，直接出片。

扣子（coze）高级实战-输入电影名，文案配音字幕全自动搞定

1️⃣ 第一步：创建工作流并定义输入

2️⃣ 第二步：用大模型生成影视解说文案

3️⃣ 第三步：TTS语音合成（免费插件：语音合成火山版）

4️⃣ 第四步：用AI生成一张封面图（免费插件：Doubao-图像生成（自接入版））

5️⃣ 第六步：官方视频剪辑工具——合成视频

6.1 音频和图片合成视频（compile_image_audio）

6.2 语音自动转字幕（audio_to_subtitle）⭐ 重点

6.3 为视频添加字幕（add_subtitles）

6️⃣ 第七步：配置结束节点并测试

⚠️ 踩坑指南

🚀 后续优化方向

批量生产：用定时触发器+电影列表，每天自动生成N条解说视频，人工挑选后发布。