第二篇:我一开始就做错了一件事:直接写 Prompt

45 阅读5分钟

我一开始就做错了一件事:直接写 Prompt

在开始之前先说明一件事:
这篇文章不是教程,也不是工具评测。

我只是想把「用 AI 做情景动画短视频」这件事,从一堆零散工具、营销话术和碎片经验中,拆成一套我自己反复使用、且能跑通的工作流。

如果后面有哪一步看起来不“高级”,那多半是我刻意为之。

为什么我会注意到这个问题

上周,我用一套新流程做了三条 AI 情景动画视频。结果发现,其中两条失败了——画面不连贯、角色变形、镜头跳帧。

我反复检查了 Prompt、模型、参数,甚至重试了十几次,却始终找不到问题所在。

直到我翻出上个月的记录,才发现一个让我尴尬的事实:我一开始就把工作流搞反了。我总是直接写 Prompt,而不是先拆分场景。

这就像没有地图就去旅行,你走得越快,离目的地越远。

这不是模型的问题,也不是我的技术问题,而是工作流的起点错了

情绪说完,我们回到技术层面。

把情绪放一边,问题到底出在哪

在 AI 创作领域,有一个普遍误区:把 Prompt 当作万能钥匙。我们总以为,只要把描述写得足够详细,AI 就能产出完美画面。

但真相是:Prompt 是约束器,不是创造器。它只能在你已经定义好的框架内工作,而不能帮你构建框架。

问题根源:任务定义不清晰

我之前常犯的错误是:给模型一个模糊的描述,比如“一个古代侠客在山顶看日落”,然后期待 AI 能理解需要什么镜头、什么动作、什么情绪。

结果 AI 会根据自己的理解生成画面,但往往偏离我的预期。比如,它可能把侠客画成现代装束,或者把山顶理解成普通山丘。

分镜的作用,是把一个模糊想法拆解成模型能理解的明确任务

分镜的真正价值:降低不确定性

分镜不是专业动画人的专利,而是把“一句话想法”变成模型能执行的步骤的过程。

一个有效的分镜应该回答:

  • 画面里有什么(角色/场景)
  • 它在做什么(动作)
  • 镜头距离(近/中/远)
  • 镜头是否运动(推拉摇移)
  • 情绪与光影(氛围)

例如,不是写“侠客看日落”,而是写:

S1: 8秒,中景,侠客站在山顶,缓缓抬头望向远方(镜头缓慢推近),夕阳暖光,浅景深,武侠氛围

这个分镜明确指出了所有关键要素,模型知道该生成什么。

技术拆解 / 流程 / 对照分析

实际对比:分镜 vs 直接 Prompt

表格

方法生成成功率一致性调整难度适合场景失败原因分析
直接写 Prompt低(约 40%)简单场景关键词不明确导致角色/场景偏差,缺乏镜头逻辑描述引发画面跳跃
先分镜再 Prompt高(约 80%)复杂叙事明确拆分任务边界,参数化描述降低 AI 理解偏差,便于逐帧调整

我用同一套内容测试了两种方法:

  • 直接 Prompt:生成 5 次,3 次角色不一致,2 次镜头错误
  • 先分镜再 Prompt:生成 5 次,4 次角色一致,1 次镜头微调

一个简单可行的分镜模板

我用以下结构来拆分每个镜头,它已经经过多次验证:

text

编辑

镜头编号:S1
时长:8秒
景别:中景(Medium Shot)
动作:主角从左侧进入,缓慢走到画面中央并抬头望向远方
画面风格:武侠风,夕阳暖光,浅景深
Prompt核心:[角色描述], medium shot, slow dolly in, warm sunset light, shallow depth of field, cinematic

这个模板的好处是:

  • 时长明确:避免 AI 生成过长视频
  • 景别清晰:避免镜头混乱(特写/中景/全景)
  • 动作具体:引导 AI 生成连贯动作(方向/速度)
  • 画面风格约束:保持整体一致性(色彩/光影/氛围)
  • Prompt 核心提取:将分镜关键要素浓缩为可直接使用的提示词

我现在的判断

经过 20 多次尝试,我发现了一个关键点:AI 视频的成功,不取决于 Prompt 的华丽程度,而在于任务是否足够清晰

与其花时间打磨“完美 Prompt”,不如花时间构建“清晰的分镜”。这就像写代码:先有清晰的逻辑,再有优雅的代码。

分镜是 AI 视频的“最小可行单元”

这个判断可能什么时候会失效?

我意识到,随着 AI 模型能力的提升,分镜的重要性可能会降低。但目前来看,它仍然是提高成功率的最有效方法。

If you 也在做 AI 视频,不妨试试这个方法:把“直接写 Prompt”换成“先写分镜” 。你会发现,不是模型不够好,而是我们的工作流需要调整。

下一步行动

我决定从今天开始,所有 AI 视频项目都遵循这个流程:

  1. 故事核心:用一句话总结视频想要传递的情感(如“孤独中的治愈”)
  2. 生成分镜草案:使用豆包 AI 的“分镜智能体”自动生成初步分镜
  3. 填写分镜模板:按模板结构细化每个镜头的参数
  4. 生成 Prompt:直接从分镜提取“Prompt 核心”字段
  5. 生成画面:使用即梦 AI 等工具生成画面(每天登录可领 60 积分,制作一次消耗 1 积分)