昨天,Claude Opus 4.6 刚发布,20 分钟后,OpenAI 立刻发布了 GPT-5.3 Codex。
这速度,绝了。
2月5日傍晚,Anthropic 发布了 Claude Opus 4.6。
刚发完推文,OpenAI 就立刻跟上了。
20 分钟。
GPT-5.3 Codex 发布。
这不是巧合,这是赤裸裸的宣战。
AI 大战,已经卷到以分钟计算了。
Opus 4.6 有多猛
先说 Claude 这次带来了什么。
100 万 token 上下文窗口。
是的,你没看错,100 万。
上一代 Opus 4.5 是 20 万,这次直接翻了 5 倍。
什么概念?
一本《三体》全系列,大概 70 万字。
Claude Opus 4.6 能一次性把整本书读完,然后回答你任何问题。
而且,价格没涨。
还是 25 输出 per 1M tokens。
Anthropic 这次是真的下血本了。
编码能力暴涨。
在 MRCR v2 这个编程基准测试上,Opus 4.6 拿到了 76%。
Sonnet 4.5 呢?18.5%。
4 倍的提升。
这不是小修小补,这是质变。
SWE-bench Verified 上,Opus 4.6 拿了 68.0%,虽然没超过 Sonnet 4.5 的 77.2%,但已经远超 GPT-5.2 Thinking 的表现。
Agent Teams。
这是 Opus 4.6 的杀手锏功能。
多个 AI Agent 可以同时协作,处理复杂的多步骤任务。
比如,一个 Agent 负责规划,另一个负责写代码,第三个负责测试。
这不是一个人在战斗,这是一个团队。
Anthropic 在发布会上说:
Opus 4.6 的 agentic coding 能力,不仅能生成代码,还能规划、推理、协调跨复杂多步骤任务。
这话听起来很技术,翻译成人话就是:
它能自己带着一群 AI 干活了。
OpenAI 的 20 分钟反击
Claude Opus 4.6 发布的时间是:2月5日晚上 6:40 PM(美国时间)。
GPT-5.3 Codex 发布的时间是:晚上 7:00 PM。
20 分钟。
OpenAI 这是盯着 Anthropic 的发布会直播,手指放在发布按钮上等着呢?
GPT-5.3 Codex 主打什么?
编程。
针对性拉满。
Codex 系列本来就是 OpenAI 的编程模型,这次 5.3 版本直接对标 Opus 4.6 的编程能力。
虽然 OpenAI 没公布详细 benchmark,但从命名上就能看出来:
这是专门为了干翻 Claude 的编程能力而来的。
除了 Codex,OpenAI 这几天还做了什么?
发布了 GPT-5.2 系列。
包括 GPT-5.2 Instant、GPT-5.2 Thinking、GPT-5.2 Pro 三个版本。
知识截止日期更新到 2025 年 8 月。
2 月 13 日,OpenAI 将停用 GPT-4o、GPT-4.1、GPT-4.1 mini 等旧模型。
GPT-4o,去年还是顶流,今年就要退役了。
AI 迭代速度,真的太快了。
20 分钟说明了什么
这 20 分钟,背后是什么?
Anthropic 和 OpenAI 已经卷到实时监控对方发布会的地步了。
你发个模型,我立刻发个针对性的反击。
你强编程,我就发 Codex。
你搞 100 万 token,我就升级 GPT-5.2 系列。
这节奏不对劲。
正常公司发新品,好歹隔几个月吧?
现在呢?
几天一次。
甚至,几小时一次。
Claude Opus 4.6 是 2 月 5 日发的。
GPT-5.2 系列是 2 月 4 日发的。
前后不到 24 小时。
这哪是竞争,这是肉搏。
用户怎么看
海外开发者社区炸了。
有人说:
AI 大战:Claude Opus 4.6 发布 20 分钟后,OpenAI 用 GPT-5.3 Codex 反击了。
有人说:
这两家公司是不是在对方办公室装了摄像头?
还有人说:
我刚订阅 Claude Max,OpenAI 就发新模型。我到底该订哪个?
这是真实的用户困惑。
以前,订阅一个 AI 产品,能用大半年。
现在呢?
订阅了,下个月可能就被新模型打得找不到北。
Claude Code 在去年 11 月还是开发者首选。
现在呢?
降智、限速、缩减用量。
OpenAI 的 Codex 也不稳定。
用户被两家公司的军备竞赛折腾得够呛。
这对我们意味着什么
20 分钟的反击战,说明了什么?
AI 大战,已经到了白热化。
以前,AI 公司还会慢慢打磨产品,几个月憋个大招。
现在呢?
对方一发布,我立刻跟上。 哪怕只是为了证明"我也能做到"。
这种节奏,对用户来说,是好是坏?
好处是:技术进步飞快。
100 万 token 上下文,一年前想都不敢想。
Agent Teams,半年前还是科幻。
现在?
都成了标配。 坏处是:用户跟不上了。
订阅哪个产品?
用哪个模型?
上个月的最强模型,这个月就被超了。
选择困难症患者表示:我太难了。
谁会赢
Claude Opus 4.6 vs GPT-5.3 Codex,谁会赢?
这个问题,可能问错了。
因为这场战争,没有终点。
Claude 发 4.6,OpenAI 发 5.3。
下个月呢?
Claude 可能发 4.7,OpenAI 可能发 5.4。
这是一场永无止境的军备竞赛。
而真正的赢家,可能是:
那些能快速迭代、持续投入、不怕烧钱的公司。
Anthropic 刚融了 130 亿美元。
OpenAI 估值 3000 亿美元。
这两家公司,都不缺钱。
缺的是什么?
时间。
谁能更快发布更强的模型,谁就能抢占市场。
20 分钟的反击战,就是最好的证明。
最后
昨天,我看到 Claude Opus 4.6 发布的推文。
然后,20 分钟后,我看到 GPT-5.3 Codex 的推文。
我的第一反应是:
卧槽,这两家公司是不是在互相监控?
然后我意识到:
这就是 AI 时代的速度。
以前,手机厂商一年开一次发布会。
现在,AI 公司一天能开好几次"发布会"。
这种速度,真的让人跟不上。
但,这也许就是未来。
Claude 和 OpenAI 的 20 分钟速度战,只是个开始。
接下来呢?
10 分钟?5 分钟? 还是,同时发布?
拭目以待。
对了,我有个AI交流群。
进群能干嘛?
• 我每天整理一份AI日报,你不用自己到处翻
• 新东西出了我会第一时间丢群里,大家一起聊
• 没广告,就图个信息互通
想进?点公众号主页 ==> 菜单栏「加群」