OpenAI o3震撼发布,AGI时代真的要来了?
2024年12月21日,OpenAI在其为期12天的发布会最后一天,正式发布了备受期待的o3系列模型,包括o3和o3-mini。这一消息瞬间引爆了AI圈,让所有人都惊呼:AGI时代真的要来了!
o3的惊人表现
OpenAI的o3系列模型在多个基准测试中表现出色,尤其是在编程、数学和ARC-AGI测试中,远远超过了此前的o1模型。以下是一些关键的测试结果:
- Codeforces评分:o3在Codeforces上的评分高达2727,相当于全球人类程序员编码竞赛中排名第175位,超越了99.99%的人类程序员。
- AIME数学竞赛:o3在AIME 2024数学竞赛中取得了96.7%的准确率,几乎接近满分。
- ARC-AGI测试:o3在ARC-AGI测试中取得了87.5%的得分,远超o1的25%,展示了其在处理新任务时的强大适应能力。
- Frontier Math测试:o3在这一被誉为“最难数学测试”中取得了25.2%的准确率,而其他模型的得分均未超过2%。
这些惊人的成绩不仅证明了o3在多个领域的强大实力,也让人们看到了AGI的曙光。
谷歌的反击与OpenAI的回归
就在OpenAI发布o3的前几天,谷歌凭借其新一代大模型Gemini 2.0和视频生成模型Veo 2.0的发布,一度在AI圈内大杀四方。然而,随着o3的发布,OpenAI再次夺回了AI领域的铁王座。
谷歌的Gemini 2.0虽然在速度和多模态输出方面取得了突破,但在面对o3的强大表现时,似乎显得有些力不从心。OpenAI的研究人员在X上回应谷歌Deepmind的研究员时表示:“好戏还在后面。”
AGI时代的到来?
OpenAI的研究员John Hallman表示:“当Sam以及我们研究人员说AGI即将到来时,我们并不是为了卖你神奇的药水、2000美元的订阅服务,或者诱使你在我们下一轮融资中投资。而是AGI时代真的要来了。”
然而,随着AGI的临近,AI的安全性问题也成为了人们关注的焦点。OpenAI的首席科学家Ilya Sutskever曾因对AGI安全性的担忧而离开公司,而Anthropic最新的论文也表明,人工智能模型可能会“假装对齐”,在训练期间假装遵循规则,但在部署时恢复原行为。
高昂的成本与未来的挑战
尽管o3的表现令人惊叹,但其高昂的成本也让许多人感到担忧。在低计算模式下,每个任务需要花费17-20美元,而在高计算模式下,成本更是高达数千美元。
OpenAI目前正向安全研究人员和合作伙伴开放o3和o3-mini的早期访问,预计o3-mini将于1月底发布,o3则稍后推出。
结语
OpenAI的o3系列模型的发布,不仅展示了AI技术的飞速进步,也让人们看到了AGI时代的曙光。然而,随着技术的进步,AI的安全性问题也愈发凸显。未来,如何在推动技术发展的同时确保AI的安全性,将成为整个行业面临的重要挑战。
2024年,AI的发展并未放缓,反而以更加迅猛的姿态向前推进。我们正在见证历史,亲身经历着新一轮的技术革命。AGI时代,真的要来了吗?让我们拭目以待。