OpenAI o3震撼发布,AGI时代真的要来了?

141 阅读3分钟

OpenAI o3震撼发布,AGI时代真的要来了?

2024年12月21日,OpenAI在其为期12天的发布会最后一天,正式发布了备受期待的o3系列模型,包括o3和o3-mini。这一消息瞬间引爆了AI圈,让所有人都惊呼:AGI时代真的要来了!

o3的惊人表现

OpenAI的o3系列模型在多个基准测试中表现出色,尤其是在编程、数学和ARC-AGI测试中,远远超过了此前的o1模型。以下是一些关键的测试结果:

  • Codeforces评分:o3在Codeforces上的评分高达2727,相当于全球人类程序员编码竞赛中排名第175位,超越了99.99%的人类程序员。
  • AIME数学竞赛:o3在AIME 2024数学竞赛中取得了96.7%的准确率,几乎接近满分。
  • ARC-AGI测试:o3在ARC-AGI测试中取得了87.5%的得分,远超o1的25%,展示了其在处理新任务时的强大适应能力。
  • Frontier Math测试:o3在这一被誉为“最难数学测试”中取得了25.2%的准确率,而其他模型的得分均未超过2%。

这些惊人的成绩不仅证明了o3在多个领域的强大实力,也让人们看到了AGI的曙光。

谷歌的反击与OpenAI的回归

就在OpenAI发布o3的前几天,谷歌凭借其新一代大模型Gemini 2.0和视频生成模型Veo 2.0的发布,一度在AI圈内大杀四方。然而,随着o3的发布,OpenAI再次夺回了AI领域的铁王座。

谷歌的Gemini 2.0虽然在速度和多模态输出方面取得了突破,但在面对o3的强大表现时,似乎显得有些力不从心。OpenAI的研究人员在X上回应谷歌Deepmind的研究员时表示:“好戏还在后面。”

AGI时代的到来?

OpenAI的研究员John Hallman表示:“当Sam以及我们研究人员说AGI即将到来时,我们并不是为了卖你神奇的药水、2000美元的订阅服务,或者诱使你在我们下一轮融资中投资。而是AGI时代真的要来了。”

然而,随着AGI的临近,AI的安全性问题也成为了人们关注的焦点。OpenAI的首席科学家Ilya Sutskever曾因对AGI安全性的担忧而离开公司,而Anthropic最新的论文也表明,人工智能模型可能会“假装对齐”,在训练期间假装遵循规则,但在部署时恢复原行为。

高昂的成本与未来的挑战

尽管o3的表现令人惊叹,但其高昂的成本也让许多人感到担忧。在低计算模式下,每个任务需要花费17-20美元,而在高计算模式下,成本更是高达数千美元。

OpenAI目前正向安全研究人员和合作伙伴开放o3和o3-mini的早期访问,预计o3-mini将于1月底发布,o3则稍后推出。

结语

OpenAI的o3系列模型的发布,不仅展示了AI技术的飞速进步,也让人们看到了AGI时代的曙光。然而,随着技术的进步,AI的安全性问题也愈发凸显。未来,如何在推动技术发展的同时确保AI的安全性,将成为整个行业面临的重要挑战。

2024年,AI的发展并未放缓,反而以更加迅猛的姿态向前推进。我们正在见证历史,亲身经历着新一轮的技术革命。AGI时代,真的要来了吗?让我们拭目以待。