这个GitHub项目把手伸进了AI视频最痛苦的地方：写prompt一个AI视频prompt工程工具包深度解析：411条实

上周有个做短视频的朋友跟我说，他花了一整天研究Kling的prompt怎么写，结果发现网上那些教程全是去年的写法。模型早更新了。气得他把浏览器关了。

我太懂了。

做AI视频的都知道，prompt怎么写是个玄学。Sora一套写法，Kling另一套，Seedance又一套。今天刷到个教程说"三步出大片"，明天模型一更新全废了。更别提你根本不知道网上那些prompt到底在哪测过、靠不靠谱。收藏夹里存了十几个"AI视频prompt大全"，点开全是2024年的内容。

这直接导致很多人卡在同一个地方：试得太多，成的太少。一个视频，光调prompt就能调一下午。

直到我看到这个项目——lanshu-awesome-ai-video-kit。

作者说了一句话让我觉得这事靠谱了："做企业AI视频项目逼出来的。"

它不是"又一个awesome list"

说实话，GitHub上AI视频的awesome list多到数不清。但这个项目不一样——它解决的不只是"收集"，而是三个硬伤：你根本不知道网上那些prompt是谁写的、在哪测的、还能不能用。

我们在做企业项目时发现：市面上AI视频prompt相关内容，来源不明（不知道谁写的、在哪测的）、过期快（2024的写法2026早跑不出了）、混杂（七拼八凑不成体系）。所以我们把踩过的坑、试过的写法、拆过的官方文档，全整理成了一个工具包。

作者把每一条prompt都带了source字段，链到官方文档或测评博客。你敢信？411条prompt，每条都写明了来源。这就解决了一个核心问题：你敢不敢用这条prompt来生成你的项目素材。

先看数据规模：

411条实测prompt（301单模型最佳实践 + 110跨模型对照）
15个视频生成模型（11商业旗舰 + 4开源）
20篇方法论SOP
7个Claude Code Skill
每周自动巡检32个官方端点

项目整体结构

最值钱的部分：15个模型一表打尽

做AI视频最头疼的其实是选模型。这个活Sora擅长，那个活Kling更好，但你不可能逐个去试。这就像你面前摆着15把不同的枪，但没人告诉你哪把打什么猎物。

这个项目做了一张15模型对比表，把这个痛点一次性解决了：

模型	强项	时长	中文支持
Seedance 2.0	综合SOTA，8要素公式，字节出品	60s 2K	★★★
Kling 3.0	中文最强+物理感+图生视频	2m	★★★★★
Veo 3.1	原生音频最强，多人对话	60s	★★
Sora 2	电影质感，极致物理	20s	★★
Hailuo 02	物理仿真业界第一	10s	★★★
Hunyuan Video 1.5	腾讯开源最强(13B)可本地跑	10s	★★★★

但真正让我觉得值的是那个选型决策树。不用纠结哪个模型好，按你的需求走几步就有答案：

我想要什么？
├── 中文剧情 + 原生音频 + 多角色对话
│   → Kling 3.0（中文）+ Veo 3.1（音频）
├── 极致电影质感
│   → Sora 2（一次性成片）或 Seedance（多镜头叙事）
├── 5-8秒紧凑短片
│   → HappyHorse（原生环境音 + 严格执行）
├── 图生视频
│   → Kling 3.0（Motion Brush）
└── 本地部署 / 可定制
    → LTX-Video（实时生成）/ Hunyuan（13B开源）

这个决策树省掉的不只是时间——它省掉的是你试错到第三款模型时的耐心。

同一个需求，5种写法

选对模型只是第一步。真正折磨人的是：同一个需求，不同模型要换不同的语言。

这个项目做了一个跨模型prompt对照。比如同样是"一个穿红裙的女人在屋顶跳舞"：

Seedance 2.0写法（8要素工程指令）：

A young woman in a flowing red silk dress dances barefoot on a rooftop at golden hour. Slow 360-degree orbit shot, low angle. Warm tungsten bounce light from city lights below. 35mm film grain.

Kling 3.0写法（5层进阶公式）：

Scene: A brick tenement rooftop at golden hour, fairy bulbs strung overhead. Characters: A young woman in flowing red silk dress, barefoot, curls catching sunlight. Action: She spins; the dress flares; she pauses, smiling, looks toward the city. Camera: Slow dolly-in then 270-degree orbit, low angle.

HappyHorse 1.0写法（30-55词紧凑版）：

A young woman in a flowing red silk dress dancing on a city rooftop at golden hour, slow circular tracking shot, warm side light, hair and dress flowing, with soft wind and distant traffic audible.

看到了吗？同一个画面，Seedance要的是摄影参数，Kling要的是剧本格式，HappyHorse要的是紧凑描述。

没有正确或错误——只有适合这个模型的。

这个项目把110组跨模型对照都做了。你再也不用经历那种"在Kling上写了半天才发现这个写法是Sora的"的尴尬。

避坑12问：没有踩过坑的人写不出这个

做AI视频的人都知道，有些问题只有"踩过才知道"。

比如人物ID漂移——生成的角色中途"换脸"了。这个问题在项目里被拆解得明明白白：根因是你把人物特写图跟全身图/服装参考图混在一起，人脸占比太小，模型压根没看清这张脸长什么样。解决方案很简单：额外准备一张只有头部的大头照，prompt里明确区分"面部特征参考图片1（大头照），妆造参考图片2（全身照）"。

再比如生成内容带字幕——明明没要求，视频里却蹦出文字。最反直觉的解法是：优先选横屏生成。横屏出现字幕的概率远低于竖屏，之后再裁切成竖屏就行了。

还有风格漂移——希望出2D动漫，参考图偏写实，结果变成真人。解法简单到离谱：prompt里加一句"2D日漫风格"。

这12个避坑问题，每一个都是企业级项目中才能真正踩出来的深度。"这个人真做过项目"和"这个人读了README"，写出来的文字一眼就能分辨。

一个隐藏的亮点：每周自动巡检

这个项目有一个机制我特别想单独拎出来讲：GitHub Action每周一自动巡检32个官方端点的API版本。

不是又一个"收集完就吃灰"的awesome list——它是活的。一旦某个模型更新了API，prompt写法变了，自动开一个issue提醒你。

在AI视频模型月月更新的2026年，这意味着你买的不只是现在的411条prompt，还有后续的持续更新。

总结

这个项目说实话还不火（217星），但内容密度很高。它解决的核心问题不是"教你怎么做AI视频"——那种教程网上多得是。它解决的是"把你创作中所有重复性、踩坑性的工作一次性标准化"。

如果你正在做：

企业级AI视频项目（这就是作者的使用场景）
AI视频自媒体内容
跨平台视频模型对比选型
本地部署视频生成模型

这个项目值得放进收藏夹。

最后说一句大实话：AI视频的生图门槛越来越低，但写prompt的门槛始终没降。这个项目不是帮你"跳过去"，而是帮你"少走很多弯路"。

项目地址：github.com/cclank/lanshu-awesome-ai-video-kit