今天凌晨,OpenAI 开启 12 月直播的第一天,直接抛出两大更新:
① 满血(正式版) o1 模型正式上线;
② 可无限使用 o1 模型的 Pro 订阅计划!
OpenAI o1模型与o1 preview模型的差异
本次OpenAI发布的o1正式版模型,在此前o1 preivew的基础上能力再次提升。
奥尔特曼介绍,o1 模型在美国数学邀请赛(AIME 2024)中的准确率达到了83.3%,远远超过了 o1-preview 的 56.7% 和早期 GPT-4o 模型的 13.4%。
编程方面,o1模型在 CodeForces 竞赛中得分为89.0%,而 o1-preview 为62.0%,GPT-4o仅为11.0%。
在GPQA Diamond(涵盖生物、物理和化学领域的AI评测数据集)博士级科学问题测试中,o1甚至超过了人类专家,准确率为78.3%,而人类专家的得分为69.7%。
总结一下,正式版OpenAI o1模型其相比o1 preview的主要变化如下(升级plus含国内镜像详细教程:升级PLUS):
- 模型的运行速度更快:官方解释,正式版o1比o1 preview的推理速度更快,每秒生成的tokens数量更多,其主要原因是推理过程(more concise in its thinking)更简洁,因此响应更快;
- 在代码、数学和推理等方面能力得到了提升:OpenAI内部测试显示,在现实的困难问题上,其错误率相比o1 preivew下降了34%,思考速度提升了 50 %。
OpenAI发布ChatGPT Pro订阅计划
除了o1模型外,本次OpenAI还新推出了一个全新的付费计划,即ChatGPT Plus会员,此前付费计划中只有Plus和Team版本。
新增的Pro付费计划费用达到了200美元一个月是ChatGPT Plus的10倍,但是可以无限制访问所有模型,并且独占o1 pro mode模式,o1 pro 使用更多的计算来更深入地思考,并为最困难的问题提供更好的答案,o1 Pro 模式的性能更恐怖,在数学方面是 o1-preview 的一倍,代码是其 2 倍。OpenAI 技术团队成员 Jason Wei 在直播活动中表示:我们预计 ChatGPT Pro 的目标用户群体将是那些已经在数学、编程和写作等领域充分利用和挑战 ChatGPT 模型能力的高级用户。
结语
汹涌澎湃的生成式 AI 浪潮,正以前所未有的速度重塑我们的时代。
就在不久前,山姆·奥尔特曼在一次专访中透露:ChatGPT 的周活跃人数已超过三亿,单日消息量惊人地达到十亿次。
在未来的一年里,OpenAI 的宏伟目标是打开十亿用户市场的大门。
接下来即将推出的 11 场直播活动,无疑是 OpenAI 蓄势已久的一波重磅动作。
让我们准备好小板凳,拭目以待这场精彩大戏的上演吧