Claude Opus 4.6 刚发布,OpenAI 20分钟后立刻杀了回来

0 阅读5分钟

昨天,Claude Opus 4.6 刚发布,20 分钟后,OpenAI 立刻发布了 GPT-5.3 Codex。

这速度,绝了。

图片

2月5日傍晚,Anthropic 发布了 Claude Opus 4.6。

刚发完推文,OpenAI 就立刻跟上了。

20 分钟。

GPT-5.3 Codex 发布。

这不是巧合,这是赤裸裸的宣战。

AI 大战,已经卷到以分钟计算了。


Opus 4.6 有多猛

图片

先说 Claude 这次带来了什么。

100 万 token 上下文窗口。

是的,你没看错,100 万。

上一代 Opus 4.5 是 20 万,这次直接翻了 5 倍。

什么概念?

一本《三体》全系列,大概 70 万字。

Claude Opus 4.6 能一次性把整本书读完,然后回答你任何问题。

而且,价格没涨。

还是 5输入/5 输入 / 25 输出 per 1M tokens。

Anthropic 这次是真的下血本了。

编码能力暴涨。

图片

在 MRCR v2 这个编程基准测试上,Opus 4.6 拿到了 76%。

Sonnet 4.5 呢?18.5%。

4 倍的提升。

这不是小修小补,这是质变。

SWE-bench Verified 上,Opus 4.6 拿了 68.0%,虽然没超过 Sonnet 4.5 的 77.2%,但已经远超 GPT-5.2 Thinking 的表现。

Agent Teams。

这是 Opus 4.6 的杀手锏功能。

多个 AI Agent 可以同时协作,处理复杂的多步骤任务。

比如,一个 Agent 负责规划,另一个负责写代码,第三个负责测试。

这不是一个人在战斗,这是一个团队。

Anthropic 在发布会上说:

Opus 4.6 的 agentic coding 能力,不仅能生成代码,还能规划、推理、协调跨复杂多步骤任务。

这话听起来很技术,翻译成人话就是:

它能自己带着一群 AI 干活了。


OpenAI 的 20 分钟反击

图片

Claude Opus 4.6 发布的时间是:2月5日晚上 6:40 PM(美国时间)。

GPT-5.3 Codex 发布的时间是:晚上 7:00 PM。

20 分钟。

OpenAI 这是盯着 Anthropic 的发布会直播,手指放在发布按钮上等着呢?

GPT-5.3 Codex 主打什么?

编程。

针对性拉满。

Codex 系列本来就是 OpenAI 的编程模型,这次 5.3 版本直接对标 Opus 4.6 的编程能力。

虽然 OpenAI 没公布详细 benchmark,但从命名上就能看出来:

这是专门为了干翻 Claude 的编程能力而来的。

除了 Codex,OpenAI 这几天还做了什么?

发布了 GPT-5.2 系列。

包括 GPT-5.2 Instant、GPT-5.2 Thinking、GPT-5.2 Pro 三个版本。

知识截止日期更新到 2025 年 8 月。

2 月 13 日,OpenAI 将停用 GPT-4o、GPT-4.1、GPT-4.1 mini 等旧模型。

GPT-4o,去年还是顶流,今年就要退役了。

AI 迭代速度,真的太快了。


20 分钟说明了什么

图片

这 20 分钟,背后是什么?

Anthropic 和 OpenAI 已经卷到实时监控对方发布会的地步了。

你发个模型,我立刻发个针对性的反击。

你强编程,我就发 Codex。

你搞 100 万 token,我就升级 GPT-5.2 系列。

这节奏不对劲。

正常公司发新品,好歹隔几个月吧?

现在呢?

几天一次。

甚至,几小时一次。

Claude Opus 4.6 是 2 月 5 日发的。

GPT-5.2 系列是 2 月 4 日发的。

前后不到 24 小时。

这哪是竞争,这是肉搏。


用户怎么看

海外开发者社区炸了。

有人说:

AI 大战:Claude Opus 4.6 发布 20 分钟后,OpenAI 用 GPT-5.3 Codex 反击了。

有人说:

这两家公司是不是在对方办公室装了摄像头?

还有人说:

我刚订阅 Claude Max,OpenAI 就发新模型。我到底该订哪个?

这是真实的用户困惑。

以前,订阅一个 AI 产品,能用大半年。

现在呢?

订阅了,下个月可能就被新模型打得找不到北。

Claude Code 在去年 11 月还是开发者首选。

现在呢?

降智、限速、缩减用量。

OpenAI 的 Codex 也不稳定。

用户被两家公司的军备竞赛折腾得够呛。


这对我们意味着什么

图片

20 分钟的反击战,说明了什么?

AI 大战,已经到了白热化。

以前,AI 公司还会慢慢打磨产品,几个月憋个大招。

现在呢?

对方一发布,我立刻跟上。 哪怕只是为了证明"我也能做到"。

这种节奏,对用户来说,是好是坏?

好处是:技术进步飞快。

100 万 token 上下文,一年前想都不敢想。

Agent Teams,半年前还是科幻。

现在?

都成了标配。 坏处是:用户跟不上了。

订阅哪个产品?

用哪个模型?

上个月的最强模型,这个月就被超了。

选择困难症患者表示:我太难了。


谁会赢

Claude Opus 4.6 vs GPT-5.3 Codex,谁会赢?

这个问题,可能问错了。

因为这场战争,没有终点。

Claude 发 4.6,OpenAI 发 5.3。

下个月呢?

Claude 可能发 4.7,OpenAI 可能发 5.4。

这是一场永无止境的军备竞赛。

而真正的赢家,可能是:

那些能快速迭代、持续投入、不怕烧钱的公司。

Anthropic 刚融了 130 亿美元。

OpenAI 估值 3000 亿美元。

这两家公司,都不缺钱。

缺的是什么?

时间。

谁能更快发布更强的模型,谁就能抢占市场。

20 分钟的反击战,就是最好的证明。


最后

图片

昨天,我看到 Claude Opus 4.6 发布的推文。

然后,20 分钟后,我看到 GPT-5.3 Codex 的推文。

我的第一反应是:

卧槽,这两家公司是不是在互相监控?

然后我意识到:

这就是 AI 时代的速度。

以前,手机厂商一年开一次发布会。

现在,AI 公司一天能开好几次"发布会"。

这种速度,真的让人跟不上。

但,这也许就是未来。

Claude 和 OpenAI 的 20 分钟速度战,只是个开始。

接下来呢?

10 分钟?5 分钟? 还是,同时发布?

拭目以待。


对了,我有个AI交流群

进群能干嘛?

• 我每天整理一份AI日报,你不用自己到处翻

• 新东西出了我会第一时间丢群里,大家一起聊

• 没广告,就图个信息互通

想进?点公众号主页 ==> 菜单栏「加群