上周有个做短视频的朋友跟我说,他花了一整天研究Kling的prompt怎么写,结果发现网上那些教程全是去年的写法。模型早更新了。气得他把浏览器关了。
我太懂了。
做AI视频的都知道,prompt怎么写是个玄学。Sora一套写法,Kling另一套,Seedance又一套。今天刷到个教程说"三步出大片",明天模型一更新全废了。更别提你根本不知道网上那些prompt到底在哪测过、靠不靠谱。收藏夹里存了十几个"AI视频prompt大全",点开全是2024年的内容。
这直接导致很多人卡在同一个地方:试得太多,成的太少。一个视频,光调prompt就能调一下午。
直到我看到这个项目——lanshu-awesome-ai-video-kit。
作者说了一句话让我觉得这事靠谱了:"做企业AI视频项目逼出来的。"
它不是"又一个awesome list"
说实话,GitHub上AI视频的awesome list多到数不清。但这个项目不一样——它解决的不只是"收集",而是三个硬伤:你根本不知道网上那些prompt是谁写的、在哪测的、还能不能用。
我们在做企业项目时发现:市面上AI视频prompt相关内容,来源不明(不知道谁写的、在哪测的)、过期快(2024的写法2026早跑不出了)、混杂(七拼八凑不成体系)。所以我们把踩过的坑、试过的写法、拆过的官方文档,全整理成了一个工具包。
作者把每一条prompt都带了source字段,链到官方文档或测评博客。你敢信?411条prompt,每条都写明了来源。这就解决了一个核心问题:你敢不敢用这条prompt来生成你的项目素材。
先看数据规模:
- 411条实测prompt(301单模型最佳实践 + 110跨模型对照)
- 15个视频生成模型(11商业旗舰 + 4开源)
- 20篇方法论SOP
- 7个Claude Code Skill
- 每周自动巡检32个官方端点

最值钱的部分:15个模型一表打尽
做AI视频最头疼的其实是选模型。这个活Sora擅长,那个活Kling更好,但你不可能逐个去试。这就像你面前摆着15把不同的枪,但没人告诉你哪把打什么猎物。
这个项目做了一张15模型对比表,把这个痛点一次性解决了:
| 模型 | 强项 | 时长 | 中文支持 |
|---|---|---|---|
| Seedance 2.0 | 综合SOTA,8要素公式,字节出品 | 60s 2K | ★★★ |
| Kling 3.0 | 中文最强+物理感+图生视频 | 2m | ★★★★★ |
| Veo 3.1 | 原生音频最强,多人对话 | 60s | ★★ |
| Sora 2 | 电影质感,极致物理 | 20s | ★★ |
| Hailuo 02 | 物理仿真业界第一 | 10s | ★★★ |
| Hunyuan Video 1.5 | 腾讯开源最强(13B)可本地跑 | 10s | ★★★★ |
但真正让我觉得值的是那个选型决策树。不用纠结哪个模型好,按你的需求走几步就有答案:
我想要什么?
├── 中文剧情 + 原生音频 + 多角色对话
│ → Kling 3.0(中文)+ Veo 3.1(音频)
├── 极致电影质感
│ → Sora 2(一次性成片)或 Seedance(多镜头叙事)
├── 5-8秒紧凑短片
│ → HappyHorse(原生环境音 + 严格执行)
├── 图生视频
│ → Kling 3.0(Motion Brush)
└── 本地部署 / 可定制
→ LTX-Video(实时生成)/ Hunyuan(13B开源)
这个决策树省掉的不只是时间——它省掉的是你试错到第三款模型时的耐心。
同一个需求,5种写法
选对模型只是第一步。真正折磨人的是:同一个需求,不同模型要换不同的语言。
这个项目做了一个跨模型prompt对照。比如同样是"一个穿红裙的女人在屋顶跳舞":
Seedance 2.0写法(8要素工程指令):
A young woman in a flowing red silk dress dances barefoot on a rooftop at golden hour. Slow 360-degree orbit shot, low angle. Warm tungsten bounce light from city lights below. 35mm film grain.
Kling 3.0写法(5层进阶公式):
Scene: A brick tenement rooftop at golden hour, fairy bulbs strung overhead. Characters: A young woman in flowing red silk dress, barefoot, curls catching sunlight. Action: She spins; the dress flares; she pauses, smiling, looks toward the city. Camera: Slow dolly-in then 270-degree orbit, low angle.
HappyHorse 1.0写法(30-55词紧凑版):
A young woman in a flowing red silk dress dancing on a city rooftop at golden hour, slow circular tracking shot, warm side light, hair and dress flowing, with soft wind and distant traffic audible.
看到了吗?同一个画面,Seedance要的是摄影参数,Kling要的是剧本格式,HappyHorse要的是紧凑描述。
没有正确或错误——只有适合这个模型的。
这个项目把110组跨模型对照都做了。你再也不用经历那种"在Kling上写了半天才发现这个写法是Sora的"的尴尬。
避坑12问:没有踩过坑的人写不出这个
做AI视频的人都知道,有些问题只有"踩过才知道"。
比如人物ID漂移——生成的角色中途"换脸"了。这个问题在项目里被拆解得明明白白:根因是你把人物特写图跟全身图/服装参考图混在一起,人脸占比太小,模型压根没看清这张脸长什么样。解决方案很简单:额外准备一张只有头部的大头照,prompt里明确区分"面部特征参考图片1(大头照),妆造参考图片2(全身照)"。
再比如生成内容带字幕——明明没要求,视频里却蹦出文字。最反直觉的解法是:优先选横屏生成。横屏出现字幕的概率远低于竖屏,之后再裁切成竖屏就行了。
还有风格漂移——希望出2D动漫,参考图偏写实,结果变成真人。解法简单到离谱:prompt里加一句"2D日漫风格"。
这12个避坑问题,每一个都是企业级项目中才能真正踩出来的深度。"这个人真做过项目"和"这个人读了README",写出来的文字一眼就能分辨。
一个隐藏的亮点:每周自动巡检
这个项目有一个机制我特别想单独拎出来讲:GitHub Action每周一自动巡检32个官方端点的API版本。
不是又一个"收集完就吃灰"的awesome list——它是活的。一旦某个模型更新了API,prompt写法变了,自动开一个issue提醒你。
在AI视频模型月月更新的2026年,这意味着你买的不只是现在的411条prompt,还有后续的持续更新。
总结
这个项目说实话还不火(217星),但内容密度很高。它解决的核心问题不是"教你怎么做AI视频"——那种教程网上多得是。它解决的是"把你创作中所有重复性、踩坑性的工作一次性标准化"。
如果你正在做:
- 企业级AI视频项目(这就是作者的使用场景)
- AI视频自媒体内容
- 跨平台视频模型对比选型
- 本地部署视频生成模型
这个项目值得放进收藏夹。
最后说一句大实话:AI视频的生图门槛越来越低,但写prompt的门槛始终没降。这个项目不是帮你"跳过去",而是帮你"少走很多弯路"。
项目地址:github.com/cclank/lanshu-awesome-ai-video-kit