2月15日,Open AI发布了第一款文生视频模型Sora,能够生成一分钟的高保真视频,一石激起千层浪。
Open AI自称Sora是“世界模拟器”。
人们惊呼:“真实世界不再存在。”
马斯克直言:人类认赌服输。
前阿里VP贾扬清评价Sora:真的非常牛。
英伟达高级研究科学家兼人工智能代理负责人Jim Fan认为Sora代表了文本生成视频的 GPT-3 时刻
Sora可以提供包括如下八大功能,排名越靠后,其功能性越强大,有些甚至都是你想不到的功能。
1、文生视频
把你的自然语言变成为视频内容,一次可生成长达1分钟的视频。
2、图生视频
根据图片衍生出视频内容。
3、视频生视频
这里就开始跟Runway Pika 拉开差距,用户上传基础视频,根据需要比如更换环境、拍摄手法等生成新的视频,未来P视频门槛会变得很低。
4、向前扩展视频
通常视频是操时间轴向前发展的,但Sora可以让时间向过去扩展,可以理解为让视频内容产生时空倒流的效果,这也是Sora强大逻辑性以及对真实世界的认知更深入。
5、视频拼接
可以根据用户提供的多个不相关的视频组合到一起,为搭建更丰富的场景提供可能。
6、3D一致性
目前市面一些视频创作工具为了视频不崩塌,通常要减少镜头的移动和旋转,不过在sora里不需要担心这个问题,它会使人物和场景始终保持一致性。也就是说Sora所生成的画面不仅仅是2D平面,更是3D立体画面的生成。
7、保持主体不变
在目前的AI工具中无法做到让生成的视频主体在切换画面、离开画面重新出现的情况下仍然保持主体的一致性,这也让我们能一眼看出是AI合成的。但Sora可以做到,这也让未来利用Sora制作长视频的可能性。
8、物理交互反馈
实际上在我们的认知里很平常的事情在利用AI技术是很难做到的,比如说吃一口汉堡,汉堡会留下被吃掉部分的缺口。但现在利用Sora实现了,也意味着AI开始做到学习并理解人类的世界,实现了人类世界与人工智能的互通。
当然目前Sora也并非是完美的,包括对空间细节的处理、难以准确模拟复杂场景中的物理现象,以及它无法理解一个实例中包含的物理因果关系,就比如一个装满水的杯子被摔碎,玻璃破碎与杯中的水的流动关系表现不和常理等。
随着Sora的发布,人们开始重新审视人工智能的发展和应用。这款模型的出现,让人们看到了人工智能在视频生成方面的巨大潜力和可能性。同时,也引发了人们对于人工智能技术的伦理和安全问题的思考和讨论。Sora模型的出现,让我们看到了人工智能技术的飞速发展。在短短的时间内,AI已经从文本生成走向了视频生成,这无疑是一个巨大的跨越。这也意味着,未来的人工智能技术将更加深入到我们的生活中,为我们带来更多的便利和惊喜。
获取sora的学习资料:kdocs.cn/l/coRvOanhpavr