第二篇：我一开始就做错了一件事：直接写 Prompt我一开始就做错了一件事：直接写 Prompt 在开始之前先说明一件事

我一开始就做错了一件事：直接写 Prompt

在开始之前先说明一件事：
这篇文章不是教程，也不是工具评测。

我只是想把「用 AI 做情景动画短视频」这件事，从一堆零散工具、营销话术和碎片经验中，拆成一套我自己反复使用、且能跑通的工作流。

如果后面有哪一步看起来不“高级”，那多半是我刻意为之。

为什么我会注意到这个问题

上周，我用一套新流程做了三条 AI 情景动画视频。结果发现，其中两条失败了——画面不连贯、角色变形、镜头跳帧。

我反复检查了 Prompt、模型、参数，甚至重试了十几次，却始终找不到问题所在。

直到我翻出上个月的记录，才发现一个让我尴尬的事实：我一开始就把工作流搞反了。我总是直接写 Prompt，而不是先拆分场景。

这就像没有地图就去旅行，你走得越快，离目的地越远。

这不是模型的问题，也不是我的技术问题，而是工作流的起点错了。

情绪说完，我们回到技术层面。

把情绪放一边，问题到底出在哪

在 AI 创作领域，有一个普遍误区：把 Prompt 当作万能钥匙。我们总以为，只要把描述写得足够详细，AI 就能产出完美画面。

但真相是：Prompt 是约束器，不是创造器。它只能在你已经定义好的框架内工作，而不能帮你构建框架。

问题根源：任务定义不清晰

我之前常犯的错误是：给模型一个模糊的描述，比如“一个古代侠客在山顶看日落”，然后期待 AI 能理解需要什么镜头、什么动作、什么情绪。

结果 AI 会根据自己的理解生成画面，但往往偏离我的预期。比如，它可能把侠客画成现代装束，或者把山顶理解成普通山丘。

分镜的作用，是把一个模糊想法拆解成模型能理解的明确任务。

分镜的真正价值：降低不确定性

分镜不是专业动画人的专利，而是把“一句话想法”变成模型能执行的步骤的过程。

一个有效的分镜应该回答：

画面里有什么（角色/场景）
它在做什么（动作）
镜头距离（近/中/远）
镜头是否运动（推拉摇移）
情绪与光影（氛围）

例如，不是写“侠客看日落”，而是写：

S1: 8秒，中景，侠客站在山顶，缓缓抬头望向远方（镜头缓慢推近），夕阳暖光，浅景深，武侠氛围

这个分镜明确指出了所有关键要素，模型知道该生成什么。

技术拆解 / 流程 / 对照分析

实际对比：分镜 vs 直接 Prompt

表格

方法	生成成功率	一致性	调整难度	适合场景	失败原因分析
直接写 Prompt	低（约 40%）	差	高	简单场景	关键词不明确导致角色/场景偏差，缺乏镜头逻辑描述引发画面跳跃
先分镜再 Prompt	高（约 80%）	好	低	复杂叙事	明确拆分任务边界，参数化描述降低 AI 理解偏差，便于逐帧调整

我用同一套内容测试了两种方法：

直接 Prompt：生成 5 次，3 次角色不一致，2 次镜头错误
先分镜再 Prompt：生成 5 次，4 次角色一致，1 次镜头微调

一个简单可行的分镜模板

我用以下结构来拆分每个镜头，它已经经过多次验证：

text

编辑

镜头编号：S1
时长：8秒
景别：中景（Medium Shot）
动作：主角从左侧进入，缓慢走到画面中央并抬头望向远方
画面风格：武侠风，夕阳暖光，浅景深
Prompt核心：[角色描述], medium shot, slow dolly in, warm sunset light, shallow depth of field, cinematic

这个模板的好处是：

时长明确：避免 AI 生成过长视频
景别清晰：避免镜头混乱（特写/中景/全景）
动作具体：引导 AI 生成连贯动作（方向/速度）
画面风格约束：保持整体一致性（色彩/光影/氛围）
Prompt 核心提取：将分镜关键要素浓缩为可直接使用的提示词

我现在的判断

经过 20 多次尝试，我发现了一个关键点：AI 视频的成功，不取决于 Prompt 的华丽程度，而在于任务是否足够清晰。

与其花时间打磨“完美 Prompt”，不如花时间构建“清晰的分镜”。这就像写代码：先有清晰的逻辑，再有优雅的代码。

分镜是 AI 视频的“最小可行单元” 。

这个判断可能什么时候会失效？

我意识到，随着 AI 模型能力的提升，分镜的重要性可能会降低。但目前来看，它仍然是提高成功率的最有效方法。

If you 也在做 AI 视频，不妨试试这个方法：把“直接写 Prompt”换成“先写分镜” 。你会发现，不是模型不够好，而是我们的工作流需要调整。

下一步行动

我决定从今天开始，所有 AI 视频项目都遵循这个流程：

故事核心：用一句话总结视频想要传递的情感（如“孤独中的治愈”）
生成分镜草案：使用豆包 AI 的“分镜智能体”自动生成初步分镜
填写分镜模板：按模板结构细化每个镜头的参数
生成 Prompt：直接从分镜提取“Prompt 核心”字段
生成画面：使用即梦 AI 等工具生成画面（每天登录可领 60 积分，制作一次消耗 1 积分）