OpenAI 发布 GPT5.2 模型,王者归来!

267 阅读3分钟

终于等到今天——ChatGPT‑5.2 今晚凌晨官宣发布!

前两天一直在传言 OpenAI 将在 12.9 发布 GPT5.2

围绕它的各种讨论、暗示、泄露层出不穷,还以为 GPT5.2 难产了呢。

12.12 凌晨 2 点,OpenAI 官推官宣,GPT-5.2 向所有人推出:

OpenAI 终于,亮剑了。

就在刚刚,OpenAI 正式宣布 GPT-5.2 全面上线:

这次一口气推出三个版本:GPT-5.2 Instant、GPT-5.2 Thinking 和 GPT-5.2 Pro。

这一次,可以说是终于把 Claude Opus 4.5 和 Gemini 3 Pro 一起按在地上使劲摩擦了!

早上起来在我的号已经刷到了,如果你的还没有,需要再等等,灰度是逐步的过程。

GPT5.2 三大版本

OpenAI 称 GPT5.2 这是迄今为止在专业知识工作方面能力最强的一代模型系列:

We are introducing GPT‑5.2, the most capable model series yet for professional knowledge work.

各方面跑分也是刷榜了,先来看图,GPT-5.2 Thinking 在几乎所有基准测试上都拿下了最高分:

SWE-Bench Pro(软件工程): 55.6%,Claude Opus 4.5 是 52.0%,Gemini 3 Pro 是 43.3%。

GPQA Diamond(科学问题): 92.4%,比 GPT-5.1 Thinking 的 88.1% 又高了一截。

AIME 2025(竞赛数学):直接打到 100%,满分。Claude Opus 4.5 是 92.8%,Gemini 3 Pro 是 95.0%。

ARC-AGI-2(抽象推理): 52.9%,而 Claude Opus 4.5 只有 37.6%,Gemini 3 Pro 是 31.1%。

FrontierMath(高等数学 Tier 1-3): 40.3%,Gemini 3 Pro 只有 37.6%。

数据展示出:

GPT-5.2 Thinking 在推理能力上已经拉开了代差。

GPT-5.2 这次是真的杀疯了!

🤯 直接把 Gemini 3 Pro 和 Claude Opus 4.5 按在地上摩擦。

两个数据吓人一跳: 1️⃣ AIME 2025 直接 100 分满分(黑人问号脸.jpg,这还是 AI 吗?) 2️⃣ GDPval 飙升到 70.9!之前的第一名才 50 多,GPT-5.1 才 30 多,这简直是降维打击。

这什么概念呢?

就是说让 GPT-5.2 Thinking 和行业内的专业人士 PK,它赢了超过七成。

而上一代 GPT-5 Thinking 只有 38.8%,连专家水平线的一半都不到。

GPT5.2 三个版本,各司其职

这次发布的三个版本定位很清晰:

GPT-5.2 Thinking 主打专业工作:

  • 最先进的长上下文推理能力
  • 表格创建、分析和格式化大幅提升
  • 幻灯片制作能力初步增强

GPT-5.2 Instant 专为日常学习和工作设计:

  • 保持了 GPT-5.1 温暖、有对话感的风格
  • 解释更清晰,关键信息优先呈现
  • 教程和指南写得更好
  • 技术写作和翻译能力更强
  • 更好地支持学习和职业指导

GPT-5.2 Pro 是最聪明、最可靠的版本:

  • 在编程等复杂领域表现更强
  • 最适合辅助和加速科学研究

GPT5.2 哪些用户能用?

OpenAI 接下来会根据订阅计划分层提供不同能力:

ChatGPT 付费用户(Plus、Pro、Business、Enterprise)今天开始陆续推送。

免费和 ChatGPT Go 用户明天开放。

GPT-5.1 会作为旧版模型(Legacy Model)保留三个月,之后下线。

免费用户有基础访问,限额较低,Plus 、Pro 或 Team 用户则能用上 GPT5.2 Thinking 等模型,且限额较为充足。

这种策略看起来是要让每种用户都能找到适合自己的“入口”。getgpt.pro

GPT5.2 前端能力?

提示词:创建一个单页应用(单个 HTML 文件),满足以下要求:

  • 名称:海浪模拟
  • 目标:展示逼真的海浪动画效果。
  • 功能:可调整风速、浪高和光照。
  • 界面:应呈现宁静且逼真的效果。

出来的效果真的非常惊艳,动态的 3D 效果!(截图没法展示)

节日贺卡生成:

END:循环,仍在继续

Sam:终于轮到我了!