AI视频生成模型全面对比与技术解析

121 阅读5分钟

对比AI视频模型

要跟上每一个新的视频模型发布步伐是困难的。本篇内容将帮助您根据需求选择最佳的模型。 分析将分为两个部分:

  • 核心模型规格:例如价格、分辨率、时长、帧率、生成速度和发布日期。
  • 功能特性:例如文生视频、图生视频、主体参照和原生音频。

所有视频模型均在 Replicate 平台上提供商业用途。

规格说明

若给出价格范围,则是基于视频时长和分辨率从最低价到最高价。生成速度同样是一个从最快到最慢的范围。时间和价格数据截至2025年7月7日。视频生成速度可能会随着模型优化或切换到更好的硬件而提升。

模型价格(每视频)分辨率时长帧率生成速度发布日期
某中心 Veo 3$6720p, 1080p8s2492s2025年5月
某中心 Veo 3 Fast$3.20720p, 1080p8s2459s2025年7月
某中心 Veo 22.502.50–4720p5–8s2435s-46s2024年12月
字节跳动 Seedance 1 Pro0.150.15–1.50480p, 720p, 1080p5s, 10s2431s-95s2025年6月
字节跳动 Seedance 1 Lite0.090.09–0.72480p, 720p, 1080p5s, 10s2425s-70s2025年6月
Minimax Hailuo 020.100.10–0.50768p, 512p, 1080p6s/10s2441s-400s2025年6月
Minimax Hailuo 02 Fast0.100.10–0.15512p6s/10s2441s-76s2025年8月
Minimax Video 01$0.50720p5s25153s2024年11月
Minimax Video 01 Live$0.50720p5s25185s2024年12月
Minimax Video 01 Director$0.50720p5s25153s2025年1月
快手 Kling 2.1 (Master)1.401.40–2.801080p5s/10s24218s-570s2025年6月
快手 Kling 2.10.250.25–0.90720p, 1080p5s/10s24122s-154s2025年6月
快手 Kling 2.0 (Master)1.401.40-2.80720p5s/10s24215s-574s2025年4月
快手 Kling 1.6 Pro0.480.48–0.951080p5s/10s30181s-350s2024年12月
快手 Kling 1.6 Standard0.250.25–0.90720p, 1080p5s/10s24121s-182s2024年12月
Leonardo Motion 2.0$0.30480p5s3281s2025年4月
Runway Gen-4 Turbo0.250.25–0.50720p5s/10s2422s-32s2025年4月
某机构 Wan 2.2 i2v0.050.05-0.11480p, 720p5s1617s-62s2025年8月
某机构 Wan 2.2 t2v0.050.05-0.10480p, 720p5s1617s-57s2025年8月
某机构 Wan 2.2 5b fast0.010.01-0.02480p, 720p5s166s-16s2025年8月
某机构 Wan 2.1 14b0.350.35-1.25480p, 720p5s1627s-110s2025年2月
Luma Ray 2 Flash0.170.17-0.54540p, 720p5s/9s2430s-53s2025年3月
Luma Ray 20.500.50-1.62540p, 720p5s/9s2447s-167s2025年1月
Pixverse Pixverse v4.50.300.30-0.80360p, 540p,720p, 1080p5s/8s3017s-60s2025年5月
Pixverse Pixverse v40.300.30-0.80360p, 540p,720p, 1080p5s/8s3017s-60s2025年2月

功能特性

模型支持不支持
某中心 Veo 3✅ 文生视频
✅ 原生音频
❌ 图生视频(起始帧)
❌ 图生视频(结束帧)
❌ 主体参照
某中心 Veo 3 Fast✅ 文生视频
✅ 原生音频
❌ 图生视频(起始帧)
❌ 图生视频(结束帧)
❌ 主体参照
某中心 Veo 2✅ 文生视频
✅ 图生视频(起始帧)
❌ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频
字节跳动 Seedance 1 Pro✅ 文生视频
✅ 图生视频(起始帧)
❌ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频
字节跳动 Seedance 1 Lite✅ 文生视频
✅ 图生视频(起始帧)
✅ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频
Minimax Hailuo 02✅ 文生视频
✅ 图生视频(起始帧)
❌ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频
Minimax Hailuo 02 Fast✅ 图生视频(起始帧)❌ 文生视频
❌ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频
Minimax Video 01✅ 文生视频
✅ 图生视频(起始帧)
✅ 主体参照 (S2V-01)
❌ 图生视频(结束帧)
❌ 原生音频
Minimax Video 01 Live✅ 文生视频
✅ 图生视频(起始帧)
❌ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频
Minimax Video 01 Director✅ 文生视频
✅ 图生视频(起始帧)
❌ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频
快手 Kling 2.1 (Master)✅ 文生视频
✅ 图生视频(起始帧)
❌ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频
快手 Kling 2.1✅ 图生视频(起始帧)❌ 文生视频
❌ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频
快手 Kling 2.0 (Master)✅ 文生视频
✅ 图生视频(起始帧)
❌ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频
快手 Kling 1.6 Pro✅ 图生视频(起始帧)
✅ 图生视频(结束帧)
✅ 主体参照
❌ 文生视频
❌ 原生音频
快手 Kling 1.6 Standard✅ 文生视频
✅ 图生视频(起始帧)
✅ 主体参照
❌ 图生视频(结束帧)
❌ 原生音频
Leonardo Motion 2.0✅ 文生视频
✅ 图生视频(起始帧)
❌ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频
Runway Gen-4 Turbo✅ 图生视频(起始帧)❌ 文生视频
❌ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频
某机构 Wan 2.2 i2v✅ 图生视频(起始帧)❌ 文生视频
❌ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频
某机构 Wan 2.2 t2v✅ 文生视频❌ 图生视频(起始帧)
❌ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频
某机构 Wan 2.2 5b fast✅ 文生视频
✅ 图生视频(起始帧)
❌ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频
某机构 Wan 2.1 14b✅ 文生视频
✅ 图生视频(起始帧)
❌ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频
Luma Ray 2 Flash✅ 文生视频
✅ 图生视频(起始帧)
✅ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频
Luma Ray 2✅ 文生视频
✅ 图生视频(起始帧)
✅ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频
Pixverse Pixverse v4.5✅ 文生视频
✅ 图生视频(起始帧)
✅ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频
Pixverse Pixverse v4✅ 文生视频
✅ 图生视频(起始帧)
✅ 图生视频(结束帧)
❌ 主体参照
❌ 原生音频

下一篇: The FLUX.1 Kontext hackathon