Vidu:可生成16 秒、1080P 视频的模型
生数科技与清华大学共同发布了中国首个长时长、高一致性、高动态性视频大模型:Vidu。
这款模型被视为国内首个达到Sora级别的视频模型。
Vidu 不仅能模拟真实物理世界,还具备丰富的想象力,支持多镜头生成和高时空一致性。
Vidu 模型融合了 Diffusion 与 Transformer 技术,创新性地开发了 U-ViT 架构。
能够一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。
在官方资料中,展示了一个视频示例,内容是“画室中的一艘船驶向镜头”,展现了船和海浪的逼真效果。
d.dedao.cn
生数科技与清华大学共同发布了中国首个长时长、高一致性、高动态性视频大模型:Vidu。
这款模型被视为国内首个达到Sora级别的视频模型。
Vidu 不仅能模拟真实物理世界,还具备丰富的想象力,支持多镜头生成和高时空一致性。
Vidu 模型融合了 Diffusion 与 Transformer 技术,创新性地开发了 U-ViT 架构。
能够一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。
在官方资料中,展示了一个视频示例,内容是“画室中的一艘船驶向镜头”,展现了船和海浪的逼真效果。
展开
评论
点赞