神仙打架!Claude Opus 4.6 和 GPT-5.3 Codex 同一天炸场💥

0 阅读1分钟

凌晨2点,AI 圈爆发了史无前例的“中门对狙”!

1:45分,Anthropic发布Claude Opus 4.6的消息刷爆了朋友圈。

我揉揉眼睛,打开电脑准备写稿。

结果20分钟后,OpenAI也扔出了GPT-5.3 Codex。

这尼玛,两家公司是商量好的吗?

作为一个每天靠AI写代码的人,我知道这绝不是普通的版本更新。

这是一场蓄谋已久的正面交锋。

说实话,为了测试这两玩意,我这头发是保不住了。

但测完之后,我背脊发凉:这已经不是“模型更新”,这是 AI 编程正式从“助手”向“数字同事”进化的分水岭。

如果你还在用旧模型修 BUG,赶紧看过来,天真的变了。

01 为什么选在同一天开战?

先说个背景。

就在前几天,GitHub刚宣布推出Agent HQ平台。

这个平台允许开发者在同一个界面里,自由切换Claude、GPT、Copilot三家的AI助手。

以前的局面是:用Cursor就绑定Claude,用Copilot就绑定GPT。

现在GitHub把货架打开了,三家产品摆在一起,用户自己挑。

这是一场赤裸裸的"货架争夺战"。

谁的产品更强,谁就能抢到更多用户。

所以两家必须在同一天亮剑——晚一天发布,就意味着在用户心智中落后一步。

我猜测,两家的产品团队早就互相盯着对方了。

发布时间选在同一天,绝非巧合。

02 Claude Opus 4.6:从“单兵作战”到“团队降维打击”

说回Anthropic,这次的更新可以用四个字形容:简单粗暴。

  • 100万上下文(1M Token)

以前改个大项目,你得像喂药一样一点点贴代码,Claude 还没改完就开始“失忆”。

现在呢?

你把整个工程、所有的文档、甚至历史日志一股脑扔进去,它不仅能接住,还能准确定位到几万行代码里的一个小逻辑漏洞。

认知颠覆: 经过测试,它的上下文推理能力几乎没有“腐烂”现象,这特么才是真正的“过目不忘”。

  • Agent Teams(多代理协作): 这是最炸裂的!

Claude Code 现在支持“组队”了。

你不需要再像个老妈子一样盯着它,你可以指定一个“组长”。

它会自发启动前端、后端、测试三个“分身”,它们之间还会互相质疑、通信、对齐接口。

以前: 你是 AI 的“保姆”,你干活,它看着。

现在: 你是 AI 的“Tech Lead”,你喝咖啡,它们一群 AI 吵架把活干了。

  • Anthropic还放出个彩蛋: Claude in PowerPoint

将Claude集成到了PowerPoint侧边栏中,让它在创建新内容之前读取现有的布局、字体和母版,读懂你的模板和品牌规范。

Claude也可以根据客户模板构建演示文稿、对现有幻灯片进行针对性编辑,改完的 slides 不会乱了格式。

03 GPT-5.3-Codex:恐怖的“自我迭代”开始了

如果说 Claude 赢在“群殴”,那 OpenAI 的 GPT-5.3 则是赢在**“智商进化”**。

最让我细思极恐的是官方博客里的一句话:“GPT-5.3-Codex 是我们第一个参与了自身创造的模型。”

Codex 团队承认,他们用早期版本来调试自己的训练代码、管理部署。

这意味着什么?

AI 开始帮人类造 AI 了。

这种自我进化的“贪食蛇”模式一旦开启,迭代速度将不再是人类能理解的。

  • 速度提振 25%: 不要小看这四分之一的提升,在长任务中,这直接决定了你是一个下午能跑 5 轮迭代,还是只能跑 3 轮。

  • 任务时长突破 24 小时: 以前你要盯着它跑,现在你可以给它一个“做个赛车游戏”的任务,然后去睡觉。醒来后,它已经自己解决了数百万 token 的逻辑冲突,成品就在桌面上。

04 中门对狙,我们该站谁?

我个人的实测建议非常直接:

场景

推荐选手

核心理由

大型工程重构

Claude Opus 4.6

1M 上下文和 Agent 团队协作,处理宏观架构更稳。

极限逻辑 Debug

GPT-5.3-Codex

智商(流体智力)更高,在 Terminal-Bench 2.0 上赢了 Claude 十个点。

快速原型开发

GPT-5.3-Codex

速度快,支持超长自主任务,主打一个省心。

PPT/Excel 辅助

Claude Opus 4.6

原生插件支持,审美和格式对齐能力目前无敌。

05 最后的最后:工具越强,人越值钱吗?

看完今晚这场“神仙打架”,我最大的感悟是:如果你还把自己定位成一个“写代码的”,那你的职业生涯真的危险了。

当 AI 能自己调优、自己组队、自己改全量工程时,“写代码”的成本正在无限趋近于零。

真正值钱的,是那个能给 AI 团队下指令、能判断产品方向、能理解人类复杂需求的 “Tech Lead 意识”

AI 会替代不用 AI 的程序员,但它替代不了那个能驾驭“AI 团队”的人。

☕️ 结尾碎碎念:奶茶与 AGI 的距离

感慨完硅谷的星辰大海,我转头看了一眼国内。

今天国内 AI 也没闲着,甚至更懂我们的胃。

阿里千问 App 搞了个“1分钱喝奶茶”的活动,结果热情的国内用户瞬间爆发,直接把服务器给薅“扑街”了,一直瘫痪到现在。

这大概就是 AI 界的魔幻现状:硅谷的大脑在忙着“自我进化”,国内的服务器在忙着“派送奶茶”。

看来,强如 AI,目前也处理不了“八千万杯奶茶”的瞬时并发。

建议阿里赶紧把刚发布的 GPT-5.3-Codex 请过来,看看 AI 能不能帮服务器做个自动扩容。

奶茶我暂时是没喝上,这篇文章建议大家先一键三连,等服务器修好了,我们边喝边聊。🥤