直播第一天!OpenAI 推出满血版o1,史上最贵会员200$/月!

233 阅读3分钟

今天凌晨,OpenAI 开启 12 月直播的第一天,直接抛出两大更新:

满血正式版) o1 模型正式上线;
② 可无限使用 o1 模型的 Pro 订阅计划

OpenAI o1模型与o1 preview模型的差异

本次OpenAI发布的o1正式版模型,在此前o1 preivew的基础上能力再次提升。

奥尔特曼介绍,o1 模型在美国数学邀请赛(AIME 2024)中的准确率达到了83.3%,远远超过了 o1-preview 的 56.7% 和早期 GPT-4o 模型的 13.4%。

编程方面,o1模型在 CodeForces 竞赛中得分为89.0%,而 o1-preview 为62.0%,GPT-4o仅为11.0%。

在GPQA Diamond(涵盖生物、物理和化学领域的AI评测数据集)博士级科学问题测试中,o1甚至超过了人类专家,准确率为78.3%,而人类专家的得分为69.7%。

总结一下,正式版OpenAI o1模型其相比o1 preview的主要变化如下(升级plus含国内镜像详细教程:升级PLUS):

  1. 模型的运行速度更快:官方解释,正式版o1比o1 preview的推理速度更快,每秒生成的tokens数量更多,其主要原因是推理过程(more concise in its thinking)更简洁,因此响应更快;
  2. 代码、数学和推理等方面能力得到了提升:OpenAI内部测试显示,在现实的困难问题上,其错误率相比o1 preivew下降了34%,思考速度提升了 50 %。

OpenAI发布ChatGPT Pro订阅计划

除了o1模型外,本次OpenAI还新推出了一个全新的付费计划,即ChatGPT Plus会员,此前付费计划中只有Plus和Team版本。

新增的Pro付费计划费用达到了200美元一个月是ChatGPT Plus的10倍,但是可以无限制访问所有模型,并且独占o1 pro mode模式,o1 pro 使用更多的计算来更深入地思考,并为最困难的问题提供更好的答案,o1 Pro 模式的性能更恐怖,在数学方面是 o1-preview 的一倍,代码是其 2 倍。OpenAI 技术团队成员 Jason Wei 在直播活动中表示:我们预计 ChatGPT Pro 的目标用户群体将是那些已经在数学、编程和写作等领域充分利用和挑战 ChatGPT 模型能力的高级用户。

结语

汹涌澎湃的生成式 AI 浪潮,正以前所未有的速度重塑我们的时代。
就在不久前,山姆·奥尔特曼在一次专访中透露:ChatGPT 的周活跃人数已超过三亿,单日消息量惊人地达到十亿次。
在未来的一年里,OpenAI 的宏伟目标是打开十亿用户市场的大门。
接下来即将推出的 11 场直播活动,无疑是 OpenAI 蓄势已久的一波重磅动作。
让我们准备好小板凳,拭目以待这场精彩大戏的上演吧