OpenAI o3震撼发布，AGI时代真的要来了？# OpenAI o3震撼发布，AGI时代真的要来了？ 2024年12

OpenAI o3震撼发布，AGI时代真的要来了？

2024年12月21日，OpenAI在其为期12天的发布会最后一天，正式发布了备受期待的o3系列模型，包括o3和o3-mini。这一消息瞬间引爆了AI圈，让所有人都惊呼：AGI时代真的要来了！

OpenAI的o3系列模型在多个基准测试中表现出色，尤其是在编程、数学和ARC-AGI测试中，远远超过了此前的o1模型。以下是一些关键的测试结果：

Codeforces评分：o3在Codeforces上的评分高达2727，相当于全球人类程序员编码竞赛中排名第175位，超越了99.99%的人类程序员。
AIME数学竞赛：o3在AIME 2024数学竞赛中取得了96.7%的准确率，几乎接近满分。
ARC-AGI测试：o3在ARC-AGI测试中取得了87.5%的得分，远超o1的25%，展示了其在处理新任务时的强大适应能力。
Frontier Math测试：o3在这一被誉为“最难数学测试”中取得了25.2%的准确率，而其他模型的得分均未超过2%。

这些惊人的成绩不仅证明了o3在多个领域的强大实力，也让人们看到了AGI的曙光。

就在OpenAI发布o3的前几天，谷歌凭借其新一代大模型Gemini 2.0和视频生成模型Veo 2.0的发布，一度在AI圈内大杀四方。然而，随着o3的发布，OpenAI再次夺回了AI领域的铁王座。

谷歌的Gemini 2.0虽然在速度和多模态输出方面取得了突破，但在面对o3的强大表现时，似乎显得有些力不从心。OpenAI的研究人员在X上回应谷歌Deepmind的研究员时表示：“好戏还在后面。”

OpenAI的研究员John Hallman表示：“当Sam以及我们研究人员说AGI即将到来时，我们并不是为了卖你神奇的药水、2000美元的订阅服务，或者诱使你在我们下一轮融资中投资。而是AGI时代真的要来了。”

然而，随着AGI的临近，AI的安全性问题也成为了人们关注的焦点。OpenAI的首席科学家Ilya Sutskever曾因对AGI安全性的担忧而离开公司，而Anthropic最新的论文也表明，人工智能模型可能会“假装对齐”，在训练期间假装遵循规则，但在部署时恢复原行为。

尽管o3的表现令人惊叹，但其高昂的成本也让许多人感到担忧。在低计算模式下，每个任务需要花费17-20美元，而在高计算模式下，成本更是高达数千美元。

OpenAI目前正向安全研究人员和合作伙伴开放o3和o3-mini的早期访问，预计o3-mini将于1月底发布，o3则稍后推出。

OpenAI的o3系列模型的发布，不仅展示了AI技术的飞速进步，也让人们看到了AGI时代的曙光。然而，随着技术的进步，AI的安全性问题也愈发凸显。未来，如何在推动技术发展的同时确保AI的安全性，将成为整个行业面临的重要挑战。

2024年，AI的发展并未放缓，反而以更加迅猛的姿态向前推进。我们正在见证历史，亲身经历着新一轮的技术革命。AGI时代，真的要来了吗？让我们拭目以待。