GPT-5.2来了,这次奥特曼玩真的

69 阅读5分钟

OpenAI 终于,亮剑了!

Sam Altman 的“Code Red(红色警戒)”,终于见响了。

就在今天凌晨 2 点,正值 OpenAI 成立十周年的日子,他们没有任何预热,直接甩出了“王炸”——GPT-5.2 正式上线。

还记得前阵子Gemini 3 Pro和Claude Opus 4.5轮番登顶,大家都说OpenAI掉队了吗?

这次,他们用最狠的方式回击了:不挤牙膏,直接碾压。

今天实测了一波,说实话,这次的感觉和以前只看跑分不一样。

如果说以前的AI是个聪明的实习生,那GPT-5.2现在的段位,起码是个带团队的资深经理

到底有多强?普通用户怎么选?涨价了值不值?

不废话,咱们直接拆干货。

01 三个版本,怎么选?

这次 OpenAI 学聪明了,不再是一个模型打天下,而是像卖咖啡一样分了三个杯型:

  • GPT-5.2 Instant(速溶版): 主打一个。平时闲聊、问个天气、查个简单概念,用它最顺手,秒回,不墨迹。
  • GPT-5.2 Thinking(思考版): 这是这次的主力军。写代码、写长文档、做数学题、做规划,它会自动开启深度思考模式。这也是目前大多数付费用户默认能用到的版本。
  • GPT-5.2 Pro(尊享版): 最强,但也最慢。适合那些你挠破头都搞不定的难题。虽然要等,但它给出的答案,大概率是目前地球上硅基生物的最高水平。

一句话总结:日常用Instant,干活通过Thinking,遇事不决上Pro。

02 别看跑分,看“疗效”:它真的懂“上班”

以前我们看AI评测,都是看它做题、写代码。但这次,OpenAI搞了个新指标,叫 GDPval

这名字听着就很有“钱味儿”,对吧?

它不测别的,专门测赚钱的活儿

OpenAI找了一帮平均工龄14年的行业老炮,出了1320道真实的“牛马任务”:

  • 给投行做个 LBO 模型表格;
  • 给市场部写个带布局建议的 PPT;
  • 给法务审一份几十页的合同。

结果呢?

GPT-5.2 Thinking 在 70.9% 的任务上,干得比人类专家好,或者至少是打平手。

注意,对手不是刚毕业的大学生,是行业专家

哪怕是更复杂的任务,它的速度是人类的 11 倍,成本不到人类的 1%。

有位参与盲测的评审员评价很扎心:

“这看起来就像是一家专业咨询公司做出来的东西,布局、建议都很老练,虽然有点小瑕疵,但那是‘总监级’的瑕疵。”

对我们来说意味着什么?

以后你扔给它一堆乱七八糟的数据,它吐出来的不再是冷冰冰的文字,而是直接能拿去会上讲的 PPT 和格式完美的 Excel。

这才是真正的“生产力工具”。

03 智商暴涨:从“背书机器”变成了“学霸”

这次有两个数据,让我看得后背发凉。

第一,是数学。

在 AIME 2025(美国数学邀请赛)里,GPT-5.2 拿了满分(100%)。

不管是 Gemini 3 Pro 还是 Claude Opus 4.5,之前还在 90 多分晃悠,GPT-5.2 直接通关了。

这意味着在逻辑严密性上,它已经没有短板。

第二,是“悟性”。

有个叫 ARC-AGI-2 的测试,非常变态。

它不考死记硬背的知识,考的是面对全新问题的推理能力(也就是流体智力)。

以前的模型,撑死能拿个17.6%,跟傻子差不多。

GPT-5.2 这次直接干到了 52.9%

翻了三倍!

这是什么概念?

以前的 AI 是靠“背题库”考高分,现在的 GPT-5.2 是真的学会举一反三了。

这也是 Windsurf 的 CEO 为什么惊呼:“版本号看着像小升级,智商其实是大跃迁。”

04 记忆力:过目不忘的“书虫”

大家以前用 AI 最烦的是什么?

文档太长,它读到后面,忘了前面。

这次,OpenAI 在“大海捞针(Needle In A Haystack)”测试里也发狠了。

在一个 256k 长度(相当于几本长篇小说)的文档里,随机插入4个不起眼的信息点。

GPT-5.2 找出来的准确率接近 100%。

之前的 GPT-5.1 只有 30% 左右,这简直是质的飞跃!

以后丢给它几十份财报、几百页的代码库,它真能做到“过目不忘,信手拈来”。

05 涨价了,还值得买吗?

说点现实的。

API的价格,标准版比GPT-5.1贵了40%。

Pro 版更是贵得离谱!

但 OpenAI 的解释也很有道理:因为它变聪明了,很多以前要来回问好几轮才能解决的问题,现在一次搞定。

算总账,可能反而便宜了。

对于 ChatGPT Plus/Pro 订阅用户: 好消息是,订阅费没涨

今天开始,Plus、Pro、Team 和企业版用户会陆续收到推送。

还没看到的别急,这两天多刷刷。

坏消息是: 大家期待已久的“成人模式”还是没影儿(Sam!你个骗子说好的12月呢?)。

不过官方说了,对于 18 岁以下用户会更严格,但对于成年人的“过度拒绝”问题,他们正在改。

Btw,Sam透露下周还会再送一些小的圣诞礼物。

写在最后

看完这次发布,我最大的感受是:OpenAI 终于不再沉迷于“造神”,而是开始琢磨怎么帮大家“干活”了。

之前的模型,总让人觉得是科学家的玩具。

而GPT-5.2,更像是一个坐在你工位旁边的、不知疲倦的超级助手。

它能帮你写那一堆烦人的周报,能帮你理顺那几十页的会议纪要,甚至能帮你搞定那复杂的Excel宏。

对于我们普通人来说,这也许是最好的时代,也是最卷的时代。

趁现在,赶紧去试试吧。

在这个AI比专家还专业的年代,学会“用人”,可能比自己“干活”更重要。

你收到 GPT-5.2 的推送了吗?准备拿它干点啥?评论区聊聊!