上周三,OpenAI发布了GPT-5.5。
距离GPT-5.4才六周。
大多数人的第一反应是:又升级了?跑分提了多少?
但这次,OpenAI自己都不怎么提跑分了。他们的官方说法是:「给GPT-5.5一个混乱的、多步骤的任务,然后信任它去规划、使用工具、检查结果、在模糊中导航。」
这句话,暴露了整个AI行业正在发生的一个根本性转向。
从「聊天模型」到「代理运行时」
过去两年,所有人评价大模型的方式是:谁的跑分高、谁的推理强、谁的上下文长。
GPT-5.5打破了这个框架。
它不是在告诉你「我更聪明了」,而是在告诉你「你不用盯着我了」。
具体来说,GPT-5.5能做什么:
- 多步骤任务自主执行,中间不需要人类干预
- 直接操作软件界面(Computer Use)
- 操作真实的文档和电子表格
- 自带网络调研能力,带引用
- 跨工具、跨时段的长任务编排
这不是一个「更好的聊天机器人」。这是一个能独立完成工作的数字员工。
定价暴露了真实意图
GPT-5.5的API定价很有意思:
| 版本 | 输入 | 输出 |
|---|---|---|
| 标准版 | $5/百万token | $30/百万token |
| Pro版 | $30/百万token | $180/百万token |
Pro版比Claude Opus 4.5还贵。
但这里有个反直觉的经济学:过去完成一个复杂任务需要3-4次模型调用,现在GPT-5.5可能1-2次就搞定。总成本反而可能更低,而且中间不需要人盯着。
OpenAI定这个价,赌的不是「每个token更便宜」,而是「每个任务更便宜」。
这是两种完全不同的商业逻辑。
六周一个版本,OpenAI在抢什么?
GPT-5.4到GPT-5.5只隔了六周。这不是研究节奏,这是产品发布节奏。
OpenAI在抢的是代理品类的定义权。
一旦用户心智中「AI代理 = ChatGPT」,后来者就很难翻盘。就像当年「搜索 = Google」一样,品类等于品牌的窗口期很短。
Anthropic和Google现在面临的压力是:你不跟进代理叙事,就会被用户认为「你们还停留在聊天时代」。
事实上,Anthropic这周也在加速——Claude Connectors刚刚接入了Spotify、Uber、Instacart等15+个日常应用,整个连接器目录已经超过200个。这不是巧合,是阵地战。
对普通人意味着什么
如果你是开发者: 过去你需要写编排逻辑把多个AI调用串起来,现在模型本身就是编排器。这会让一大批「AI中间件」公司的生意变得很尴尬。
如果你是产品经理: 用户期望正在快速迁移。「帮我查个东西」已经不够了,用户会开始期待「帮我把这件事做完」。
如果你只是一个AI用户: 别再比较「谁答得准」了。下一个阶段的问题是:谁能替我做完一整件事,从头到尾,不需要我一步步指挥?
真正的认知差
大多数人还在用「模型好不好」的框架看AI。
但行业已经翻页了。
2024年的竞争是:谁的模型最聪明。 2025年的竞争是:谁的上下文最长、推理最强。 2026年的竞争是:谁能替用户把事情做完。
GPT-5.5不是一次性能升级。它是OpenAI正式宣布:聊天时代结束了,代理时代开始了。
六周后,GPT-5.6大概率又会来。但版本号不重要。重要的是,你有没有意识到——
AI的价值衡量标准已经从「回答质量」变成了「任务完成率」。
这个转变,比任何一次模型发布都重要。