上线即瘫痪!Sora正式版“贵是真的贵,强是真的强”

154 阅读9分钟

还不知道怎么订阅 Sora,chatgpt和国外app服务的同学,

有魔法可以看这里:WildCard官方平台订阅chatgpt,Sora

没有魔法的可以看这个:银河录像局 次世代合租平台

OpenAI 的“ 12 天发布会大戏”唱到第三场,Sora 终于来了!

12 月 10 日,OpenAI 宣布正式向用户开放人工智能视频生成模型 Sora,距离 OpenAI 首次公开预览这款产品,已过去 10 个月。

上线即瘫痪!Sora正式版“贵是真的贵,强是真的强”

时间并没有让 Sora 热度减退,用户蜂拥而至,官方网站瞬间流量激增,直至崩溃,一度暂停注册和登录服务。

OpenAI 说:“这是给大家准备的(圣诞)节日礼物。”

贵是真的贵

4 美元生成 5 秒 1080P 视频

两个月前,《IT 时报》曾报道,Sora 亮相超过半年却迟迟未能正式上线,与其高昂的视频生成成本有直接关系。

Logenic AI 联合创始人李博杰曾向记者指出,此前发布的 Sora 模型本身需要占用大量计算资源,生成一分钟视频的时间高达约半小时,且并非单台设备完成,而是需要多台并行运行,1 分钟视频的成本可能超过 100 美元。

李博杰认为,Sora 如何微调成更小、更具成本效益的模型,以在特定任务上接近高级模型的性能,是其要解决的首要问题。

随着 Sora 正式发布,OpenAI 在 X 平台上表示,自 2 月份以来,他们一直在构建 Sora Turbo,后者是一个速度明显更快的模型版本,今天将其作为独立产品向 Plus 和 Pro 用户开放。

记者注意到,相比初次亮相的 Sora,Sora Turbo 生成效率显著提升,能够通过文本直接生成最多 20 秒或最高分辨率 1080P 的视频,成为目前全球生成时长最长的视频模型之一。该模型支持文本加图片或视频的输入,可生成特定视频内容,并能够编辑生成视频,使生成效果更加可控。

Sora Turbo 采用了灵活的积分制定价策略,需要耗费的积分因分辨率和持续时间而异,已经是 ChatGPT Plus 和 Pro 会员的用户,无需额外费用就能使用。

上线即瘫痪!Sora正式版“贵是真的贵,强是真的强”

积分价格表

比如生成一个 480P、5s 的视频需要 25 个积分,如果生成 480P、20s 的视频则需要 150 个积分。此外,如果使用 Remix(重混)、Re-cut(重新剪辑)、Storyboard(故事板)、Loop(循环)、Blend(混合)这些功能,则需要额外的积分。

添加图片注释,不超过 140 字(可选)

上线即瘫痪!Sora正式版“贵是真的贵,强是真的强”

额外积分表

对于订阅用户而言,ChatGPT Plus 计划每月 20 美元,包含 1000 积分,支持最高 720p 分辨率和 5 秒时长的视频生成;而 200 美元的 ChatGPT Pro 计划提供 10000 积分,支持最高 1080p 分辨率、20 秒时长,并支持同时生成最多 5 个视频。

由此计算,每积分成本为 0.02 美元(约人民币 0.145 元),在不使用其他功能的前提下,Sora 生成一个 5 秒 480P 视频成本为 0.5 美元,折合人民币 3.63 元。生成 5 秒 1080p 视频成本为 4 美元(约人民币 27.6 元)。

这一定价也引发了不同的声音,有用户直呼“太贵”,有用户却认为“一分钱一分货”。

视频创作者俞国汉向《IT 时报》记者表示,相较于 Runway 提供的 95 美元 / 月服务,订阅费 200 美元 / 月的 Sora,在性能和功能上完全值得。

虽然当前价格仍被部分用户认为偏高,但这已是 OpenAI 努力降低成本的结果。OpenAI 还透露,他们计划针对不同用户类型开发新的定价模式,并将于明年初推出。

需要注意的是,Sora 暂不支持 ChatGPT Team、Enterprise 和 Edu 用户,也不向 18 岁以下用户开放。此外,英国、瑞士和欧盟等地区目前无法访问 Sora。

目前,Sora 已进入无限制使用阶段,想要体验的用户可以抓紧时间试用。

体验者反馈

视频一致性大突破

Sora 一经上线,已经有一大批视频创作者迫不及待地争先试用。

一位专业视频博主在体验正式版 Sora 后总结认为,不管是用户体验的完整性,还是视频修改与编辑的丰富性,Sora 都非常强大,运动效果十分流畅,故事板生成视频的一致性也很“完美”。

记者注意到,OpenAI 在直播及官网上详细介绍了 Sora 的几项核心功能,包括 Remix(重混)、Re-cut(重新剪辑)、Storyboard(故事板)、Loop(循环)、Blend(混合)以及 Style presets(风格预设)。

上线即瘫痪!Sora正式版“贵是真的贵,强是真的强”

作为 Sora 的一项亮点功能,Storyboard(故事板)通过带有关键帧的时间轴,允许用户在个人时间轴上组织和编辑独特的视频序列。这项功能为创作者提供了更大的创作空间,使视频内容的规划与调整更加灵活。

Remix(重混)功能使用户能够替换、删除或重新构想视频中的元素,赋予用户更高的自由度来塑造最终效果。例如,官网的演示视频中,用户可以将设计的“打开大门通向图书馆”场景中的普通大门替换为法式对开门,可以将图书馆变成一艘宇宙飞船,甚至可以轻松地移除宇宙飞船,替换成一片丛林,最后再用月球景观代替丛林,创造出富有创意和变化的视频效果。

Re-cut (重新剪辑)功能让用户能够从视频中找到最佳的帧并向任意方向延伸,从而精细调整视频内容。Loop (循环)可通过在开头和结尾添加额外帧来连接视频片段,创建无缝的重复视频,达到平滑循环的效果。Blend (混合)则允许用户将两个完全不同的视频融合成一个无缝剪辑,创造和谐的过渡效果。

Style presets(风格预设)使用户能够根据自己的创意,选择或自定义不同的风格,实现快速创作。例如,用户可以将两头猛犸象在雪地里走路的场景,转换成纸工艺品风格。

有体验者分享到,Sora 正式版功能比自己想象得更丰富,尤其是 Remix、Blend、Loop 等功能让他感到耳目一新,而 Storyboard 功能则最为令人印象深刻。

在此前的采访中,俞国汉就曾指出,商用 AI 视频制作中,画面一致性、分辨率和语义理解能力是决定视频质量的关键因素。

尽管文生视频技术为创意工作开辟了新的空间,但其现有的局限性使它在商业应用中的价值远不及图生视频。目前来看,文生视频大模型大多时候更像是爱好者的“玩具”,难以满足商业需求。因为在短剧制作中,需要确保人物形象和其他元素的一致性,而文生视频往往只能生成几秒钟的内容,且下一秒的内容可能会发生变化,这显然无法满足专业制作的要求。

李博杰此前也提到,在技术层面,文生视频面临的关键挑战之一是风格一致性的问题。例如,在生成一个 10 秒的视频时,人物形象是否保持一致,是否会出现前后视频中人物外貌不符的情况。此外,视频中的物理规律是否符合常识也是一个难点。

而此次发布的正式版 Sora,被体验者盛赞:通过不同的 Prompt,Sora 能够生成几乎完美一致性的分镜,从而组成一段流畅的影片。其 Storyboard 功能尤为出色,能够通过时间轴中的分镜帧引导每个画面的内容,确保镜头一致性,并支持可控的镜头切换和多动作引导。

上线即瘫痪!Sora正式版“贵是真的贵,强是真的强”

视频版 GPT-1

有不足却仍遥遥领先

俞国汉在接受《IT 时报》记者采访时表示,尽管他尚未亲自体验 Sora,但从目前与其他创作者的交流来看,Sora 显然超越了以往的文生视频工具,展现了更强大的功能。他直言:“贵是真的贵,强也是真的强。”

他进一步指出,前不久腾讯开源了混元大模型,大家都认为当前开源技术已接近闭源的水平,但 Sora 一推出,显示了闭源技术依旧领先一代,表现出更强的实力和潜力。

另一方面,在试用者们的反馈中,如果说 Sora 的文生视频能力尚且褒贬不一,其图生视频的表现则不尽如人意。俞国汉透露,在与同行的交流中,正式版 Sora 的图生视频能力遭到不少批评:“大家都对 Sora 的图生视频表现感到吃惊,认为其效果非常差。”

国外科技博主 Marques Brownlee 也在测评一周后表示,Sora 存在一些弊端,如对物理规律的理解并不够好,仍会出现人的手部不自然、文字乱码、动物跑着跑着就飞起来等情况。

此外,OpenAI 还开发了全新 UI,并提供社区分享服务,允许用户分享自己生成的视频,或借鉴他人的提示效果来完善自己的作品。

奥特曼在 X(推特)发文表示,最令他兴奋的一点是与其他人共同创作的便捷性,感觉就像是一个有趣的新事物。大家可以将 Sora 看作视频版的 GPT-1。

随着 Sora 正式版发布,文生视频领域又将再次“变天”。