相隔7周推出新模型,OpenAI 这次不是在发布 GPT-5.5,是在发布一种压力

0 阅读5分钟

昨天晚上OpenAI新模型 GPT-5.5 正式发布,距离 GPT-5.4 发布,刚好七周。

昨天还在感慨GPT-Image-2的强大,今天又来了一个新模型。

最新生图模型GPT-Image-2发布,中文无乱码!商用价值拉满!附如何体验到 GPT-Image-2 呢?

不过这迭代速度有点快了!

GPT-5.5 到底是什么

先把基本信息说清楚。

GPT-5.5,内部代号 Spud,2026 年 4 月 23 日正式发布。

这是 OpenAI 自 GPT-4.5 以来,第一个完全重新训练的基础模型。不是微调,不是 patch,是从头来过。

Greg Brockman 在发布会上说了一句话,我觉得是这次发布的核心定义:

"a new class of intelligence for real work and powering agents"

翻译过来就是:这不是一个更聪明的聊天机器人,这是一个能自己干活的 Agent。

具体能干什么?

写代码、调试、跑研究、分析数据、操作电脑——这些任务,GPT-5.5 可以接到一个"乱七八糟的多步骤任务",自己拆解、自己用工具、自己检查结果,不需要你一步一步喂指令。

OpenAI 的原话是:可以处理 "messy, multi-part tasks" 并独立完成。

数据说话

先说结论:GPT-5.5 在"自主完成任务"这个维度上领先明显,传统知识推理的提升基本可以忽略。

不同 benchmark 测的是完全不同的东西,分开看才有意义。

agentic 编程能力

这是 GPT-5.5 最强的地方,也是 OpenAI 这次主打的方向。

SWE-bench 标准版测的是:给一个真实的 GitHub issue,模型能不能一次修好。GPT-5.5 的单次通过率是 58.6% ——超过一半的概率,一次搞定。

但 SWE-bench 有个问题:题目都是公开的,模型训练时可能见过,存在数据污染风险,训练数据的暴露会在不知不觉中抬高分数。所以更有参考价值的是 Expert-SWE,专门挑那些需要跨文件理解、长上下文推理的复杂 bug,更接近真实工程师日常遇到的问题。GPT-5.5 在这里得了 73.1%

还有 Terminal-Bench 2.0,测的是完整的命令行工作流:给一个复杂任务,模型要自己规划步骤、调用工具、迭代修正、最终跑通。GPT-5.5 得了 82.7% ,Claude Opus 4.7 是 69.4%,差了 13 个百分点。

操作电脑

OSWorld-Verified 测的是模型能不能像人一样操作真实界面——点击、填表、在操作系统里完成任务。

GPT-5.5 是 78.7% ,Claude Opus 4.7 是 78.0%,两者基本持平,

所以 OpenAI 这次押注的方向很清楚:不是"更聪明",是"更能干活"。

价格:贵了一倍

这里有一个让人有点皱眉的消息。

API 定价:

  • 输入:$5 / 百万 tokens
  • 输出:$30 / 百万 tokens

这大概是 GPT-5 的两倍,目前还未推出。

GPT-5.5 Pro 版本更贵:30/30 / 180 per million tokens。

**对于普通 ChatGPT 用户,Plus、Pro、Business、Enterprise 订阅者今天就能用,ChatGPT 和 Codex 都已经上线。**API 版本 OpenAI 说"very soon"。

免费用户暂时没有。

切换方式:打开 ChatGPT,模型选择器里找 GPT-5.5,直接切换就行。Codex 里也同步更新了。

贵不贵?看你怎么用。

如果你是个人用户,订阅费没变,直接升级了。

如果你是开发者,要把它接进产品,这个价格需要认真算一下 ROI。

国内用户怎么升级

如果你还不知道怎么升级到GPT Plus或Pro的话,可以看一下我们自己的代充服务。

比官网20美金、100美金充值更便宜,封号概率低于0.1%,为了给足客户的信任,承诺就算封号或掉订阅也会有质保按天退款!!!

不仅免去了每年的开卡费用,升级价格也比官网更加优惠,并且提供售后保障,若封号按天退款。操作便捷,1分钟即可轻松完成升级!

升级网址:gptplus.uno

觉得升级费用暂时承担不起,也可以看看ChatGPT&Claude镜像站,价格会比官方便宜很多很多,对话次数不受限制(midjourney绘画功能同步推出)👇

如何在国内低成本一次性使用到ChatGPT、Claude、Grok、Gemini等海内外主流AI模型

最后有话说

有一件事我一直在想,但没想清楚。

以前我们说"工具依赖"是个坏事——太依赖某个平台,有一天它涨价或者跑路,你就完了。

但现在的情况变了。

GPT-5.5 发布的时间点,是 Anthropic 发布 Claude Opus 4.7 的一周之后。OpenAI 六周出一个新模型,Anthropic 紧跟着。这个速度下,你根本来不及"依赖"——你刚熟悉一个工具,下一个已经来了。

而且最近 OpenAI 的节奏异常地快,不只是模型。$100 套餐、火爆全网的 GPT-Image-2、带着点 OpenClaw 影子的 Codex 新功能——每隔几天就有一件事要你去关注、去判断、去决定要不要跟上。

OpenAI 在用发布节奏本身传递一个信号:你刚觉得 Claude 很强,我这里又有新的了。

这不是依赖,这是一种持续的注意力消耗。

每次发布,你都要重新评估:要不要切换?值不值得学?现在用的够不够用?

这个问题本身就在消耗你。

我没有答案。但我觉得,在这个节奏里,真正值钱的能力不是"用最新的模型",而是"知道什么时候不需要换"。

GPT-5.5 很强。但如果你现在的工作流跑得好好的,不换也没什么损失。

待久了,才成了借口。