2.16 日凌晨,OpenAI再次扔出一个深水炸弹,发布了自己首个文生视频模型Sora。毫无疑问,这将加速AI的发展。
Sora是什么?
Sora 是OpenAI最新发布的文本生成视频模型,不仅可以生成长达一分钟的视频,且能完全遵照用户的 Prompt 并保持视觉质量。
用户只需提供描述视频场景的文本提示,Sora 就能将该场景变成最长 60 秒的全动态视频。
1.Sora官网
2.技术特点:
简单可以概括以下几个方面:
文本到视频的生成能力
Sora根据用户提供的文本,最长可生成达到60s长的视频。
复杂场景和多人物角色
Sora通过深入理解物体在现实世界中的存在方式,具备创建复杂场景和多人物角色的能力。它能够解释道具、生成表现出丰富情感的角色,充分展示了对物体存在的出色理解。
整体视频生成
Sora具备一次性生成整个视频的能力。确保了生成视频过程中人物、环境等一致性问题。
图片生成视频
还能够获取现有的静止图像并从中生成视频,从而准确无误地对图像内容进行动画处理,并注意小细节。
视频可以向前扩展
runway和pika视频只能向后延伸,Sora可以做到既可以向后延伸也可以向前延伸。
**简单总结来说:“60s超长视频长度”,“单视频多角度镜头”
3.生成效果图
a. Prompt: A litter of golden retriever puppies playing in the snow. Their heads pop out of the snow, covered in.
b: Prompt: Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.
c: Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
从生成的视频中,我们不得不感叹 sora 的强大!!
3.Sora怎么使用
需要强调给大家的一点是,截止至2024年2月17日,Sora目前没有公开测试,也没有内测申请渠道,国内是没有渠道可以去尝试的,因此大家千万不要相信现在所谓的Sora课程,这些人都自己没有操作过。
获取sora的学习资料:kdocs.cn/l/coRvOanhpavr