如何用 sora?Sora 保姆级入门使用手册

278 阅读4分钟

Sora: 开创视频创作新纪元

PS:目前 openai 官方还未开放 sora 灰度,根据 dalle 和 gpts 的经验,肯定是优先ChatGPT Plus 付费用户使用,需要注册或者升级 GPT Plus 可以看这个教程: 保姆级升级 GPT 4 的教程 ,一分钟完成升级

2024年2月16日,OpenAI在其官方网站上正式宣布了一个划时代的文本到视频的大型模型——Sora。此模型标志着视频创作领域的一大步进展,使得根据简单文本描述生成长达60秒的高质量视频成为可能。当前,Sora尚处于灰度测试阶段,预计将优先向ChatGPT Plus付费用户提供使用权限。对于有意体验或升级至GPT Plus的用户,可以参照升级ChatGPT Plus的教程一探究竟。

Sora的特点

综合 Sora 和其他模型对比,他这么强体现在以下两个方面

  • 空间连续性:在多个分镜中保持物体连续
  • 时间连续性:在线性时间推进,物体能够保持连贯,面包仍然是面包,大象是大象
  • 世界模型模拟:sora 通过大规模参数训练涌现出了某种物理规律理解的能力:如在我的世界视频中,光标颜色会随镜头切换而改变
  • 长度超出预期:之前的生成视频长度大都在 3-5s,而 sora 一口气可以生成 60s 的视频

Sora的应用展示

Sora的应用横跨多个领域,如教育、产品演示、内容营销等,以下是一些精彩的使用案例展示:

  • 东京霓虹街头:一位时尚女性在充满霓虹灯光和活力的东京街头自信漫步。
  • 雪地巨型长毛象:几只长毛象在雪地中缓慢行走,背景是雪覆盖的树木和山峦。
  • 加州淘金热历史影像:展现加利福尼亚淘金热时期的珍贵历史镜头。
  • 禅宗花园玻璃球:一个玻璃球内部的禅宗花园,其中有个小矮人正在整理沙地。
  • 卡通袋鼠迪斯科舞:一只卡通袋鼠在舞池中翩翩起舞。
  • 野外探险:一辆白色老式SUV在陡峭的山路上驰骋,周围是红杉和松树。
  • 东京郊区列车之旅:列车穿越东京郊区,窗户映出的倒影。
  • 艺术画廊之旅:参观多风格的精美艺术品。
  • 生日庆祝:一位祖母在生日蛋糕前吹熄蜡烛的温馨时刻。
  • 中国农历新年庆祝:中国龙的农历新年庆祝视频。

部分视频截图

如何使用Sora

在使用Sora前,请确保已注册并升级至OpenAI账户)(大概率 Plus 会员才能用),获取Sora的访问权限。使用步骤如下:

  1. 准备文本描述:登录OpenAI账户,进入Sora界面,输入您的视频创意文本描述。
  2. 生成视频:提交文本后,点击“生成视频”,Sora将处理您的请求并生成视频。

看完 Sora 的 prompt,可能仍然对 Prompt 是一个不小的考研,因为涉及到故事情节设计,分镜等,语言表达是一个不小的挑战。

截至2024年2月18日,Sora的访问权限仍然限于部分专业用户,但OpenAI已发布了大量的案例(约 100 个)

技术背景

Sora基于Transformer架构,采用了扩散模型来提高生成视频的质量和多样性。此外,Sora模型通过数据处理和压缩技术,在保持高质量视频输出的同时,优化存储使用。

详细技术报告可以参考我的另一篇文章:4000 字入门 Sora & 变现案例分析

变现思路分析

提供部分变现思路:

  • 售卖 Sora 账号或者邀请码
  • 售卖高质量的视频生成 prompt
  • 制作/代生成 ai 视频
  • 使用 Sora 生成的视频,做个人的自媒体账号
  • 电商:围绕 sora 搜索词做生意
  • 套壳网站

常见问题解答

  • Sora能做什么? :Sora能根据文本描述生成高达60秒的视频,适用于多种场景和主题。
  • 如何开始使用Sora? :需登录OpenAI账户,并通过Sora界面提交视频描述。
  • Sora的优势在哪里? :Sora基于最新的AI技术,能生成高质量、逼真的视频内容。

Sora开启了AI视频创作的新时代,不论是专业人士还是视频制作爱好者,都可以轻松创作出富有创意的视频内容。随着技术的进一步发展,期待Sora为视频创作领域带来更多革新,后面有技术报告会第一时间跟进