相隔7周推出新模型，OpenAI 这次不是在发布 GPT-5.5，是在发布一种压力昨天晚上OpenAI新模型 GPT-

昨天晚上OpenAI新模型 GPT-5.5 正式发布，距离 GPT-5.4 发布，刚好七周。

昨天还在感慨GPT-Image-2的强大，今天又来了一个新模型。

不过这迭代速度有点快了！

GPT-5.5 到底是什么

先把基本信息说清楚。

GPT-5.5，内部代号 Spud，2026 年 4 月 23 日正式发布。

这是 OpenAI 自 GPT-4.5 以来，第一个完全重新训练的基础模型。不是微调，不是 patch，是从头来过。

Greg Brockman 在发布会上说了一句话，我觉得是这次发布的核心定义：

"a new class of intelligence for real work and powering agents"

翻译过来就是：这不是一个更聪明的聊天机器人，这是一个能自己干活的 Agent。

具体能干什么？

写代码、调试、跑研究、分析数据、操作电脑——这些任务，GPT-5.5 可以接到一个"乱七八糟的多步骤任务"，自己拆解、自己用工具、自己检查结果，不需要你一步一步喂指令。

OpenAI 的原话是：可以处理 "messy, multi-part tasks" 并独立完成。

数据说话

先说结论：GPT-5.5 在"自主完成任务"这个维度上领先明显，传统知识推理的提升基本可以忽略。

不同 benchmark 测的是完全不同的东西，分开看才有意义。

agentic 编程能力

这是 GPT-5.5 最强的地方，也是 OpenAI 这次主打的方向。

SWE-bench 标准版测的是：给一个真实的 GitHub issue，模型能不能一次修好。GPT-5.5 的单次通过率是 58.6% ——超过一半的概率，一次搞定。

但 SWE-bench 有个问题：题目都是公开的，模型训练时可能见过，存在数据污染风险，训练数据的暴露会在不知不觉中抬高分数。所以更有参考价值的是 Expert-SWE，专门挑那些需要跨文件理解、长上下文推理的复杂 bug，更接近真实工程师日常遇到的问题。GPT-5.5 在这里得了 73.1% 。

还有 Terminal-Bench 2.0，测的是完整的命令行工作流：给一个复杂任务，模型要自己规划步骤、调用工具、迭代修正、最终跑通。GPT-5.5 得了 82.7% ，Claude Opus 4.7 是 69.4%，差了 13 个百分点。

操作电脑

OSWorld-Verified 测的是模型能不能像人一样操作真实界面——点击、填表、在操作系统里完成任务。

GPT-5.5 是 78.7% ，Claude Opus 4.7 是 78.0%，两者基本持平，

所以 OpenAI 这次押注的方向很清楚：不是"更聪明"，是"更能干活"。

价格：贵了一倍

这里有一个让人有点皱眉的消息。

API 定价：

输入：$5 / 百万 tokens
输出：$30 / 百万 tokens

这大概是 GPT-5 的两倍，目前还未推出。

GPT-5.5 Pro 版本更贵： $30 /$ 180 per million tokens。

**对于普通 ChatGPT 用户，Plus、Pro、Business、Enterprise 订阅者今天就能用，ChatGPT 和 Codex 都已经上线。**API 版本 OpenAI 说"very soon"。

免费用户暂时没有。

切换方式：打开 ChatGPT，模型选择器里找 GPT-5.5，直接切换就行。Codex 里也同步更新了。

贵不贵？看你怎么用。

如果你是个人用户，订阅费没变，直接升级了。

如果你是开发者，要把它接进产品，这个价格需要认真算一下 ROI。

国内用户怎么升级

如果你还不知道怎么升级到GPT Plus或Pro的话，可以看一下我们自己的代充服务。

比官网20美金、100美金充值更便宜，封号概率低于0.1%，为了给足客户的信任，承诺就算封号或掉订阅也会有质保按天退款！！！

不仅免去了每年的开卡费用，升级价格也比官网更加优惠，并且提供售后保障，若封号按天退款。操作便捷，1分钟即可轻松完成升级！

升级网址：gptplus.uno

觉得升级费用暂时承担不起，也可以看看ChatGPT&Claude镜像站，价格会比官方便宜很多很多，对话次数不受限制（midjourney绘画功能同步推出）👇

如何在国内低成本一次性使用到ChatGPT、Claude、Grok、Gemini等海内外主流AI模型

最后有话说

有一件事我一直在想，但没想清楚。

以前我们说"工具依赖"是个坏事——太依赖某个平台，有一天它涨价或者跑路，你就完了。

但现在的情况变了。

GPT-5.5 发布的时间点，是 Anthropic 发布 Claude Opus 4.7 的一周之后。OpenAI 六周出一个新模型，Anthropic 紧跟着。这个速度下，你根本来不及"依赖"——你刚熟悉一个工具，下一个已经来了。

而且最近 OpenAI 的节奏异常地快，不只是模型。$100 套餐、火爆全网的 GPT-Image-2、带着点 OpenClaw 影子的 Codex 新功能——每隔几天就有一件事要你去关注、去判断、去决定要不要跟上。

OpenAI 在用发布节奏本身传递一个信号：你刚觉得 Claude 很强，我这里又有新的了。

这不是依赖，这是一种持续的注意力消耗。

每次发布，你都要重新评估：要不要切换？值不值得学？现在用的够不够用？

这个问题本身就在消耗你。

我没有答案。但我觉得，在这个节奏里，真正值钱的能力不是"用最新的模型"，而是"知道什么时候不需要换"。

GPT-5.5 很强。但如果你现在的工作流跑得好好的，不换也没什么损失。

待久了，才成了借口。