说点不一样的。GPT-5.3 与 Claude Opus 4.6 同时炸场，前端变天了？早上一起来，手机就被刷屏了...

大家好，我是 Sunday。

早上一起来，手机就被刷屏了...各大号主都在写 OpenAI 和 Anthropic 在昨天晚上发布的最新模型 GPT-5.3-Codex 和 Claude Opus 4.6

我看了一眼各大号主的文章，发现大家都在狂欢（真假不重要，至少文章中都在狂欢），都在发跑分截图。有的说 Claude 的 一百万（1M）上下文无敌 了，有的说 GPT-5.3 的 OSWorld 分数太吓人。

Claude 提供百万上下文

GPT-5.3 的 OSWorld 跑分

但是，Sunday 作为一个写了十几年代码、现在天天琢磨怎么用 AI 提效的“老前端”。看了这两篇长达数万字的技术文档之后，却并没有其他博主反应的那么兴奋。

为什么呢？

因为，Sunday 发现在这两篇文章中，顶级 AI 模型目前争论的焦点，已经完全不是“谁写的代码 Bug 少”这么简单了，他们正在重新定义什么是“写代码”？

所以，今天这篇文章，Sunday 就我不带大家像看热闹一样去比那些虚无缥缈的跑分（虽然跑分都很高），我想带大家从另外一个角度，来看看这次更新的核心内容。或许大家看完之后，能有不一样的收获。

一、 Claude Opus 4.6

先说 Anthropic 的 Claude Opus 4.6。

大家都在吹 100 万 Token 上下文（1M Context）。

很多人对这个数字没概念，觉得不就是：“可以把一个超级大的文档扔给 Claude 让他处理了吗？”

错。大错特错。

想要明白这个，我们需要先知道 AI 写代码到底是怎么去写的！

在 Opus 4.6 之前，我们用 AI 写代码是 “切片式” 的。

什么意思呢？

比如：你的项目可能有 500 个文件，但你每次只能复制粘贴那 3 个相关的文件给 AI。 AI 每次也只是读取其中的部分文件的部分代码。简单理解就是：AI 是看不见的全局架构设计的。它看不见你的隐藏依赖、架构设计方案、更不了解你 CSS 中可能会存在的全局污染问题。

所以，AI 经常会写出那种 “局部完美，全局崩盘” 的代码。

之前我们的处理方式都是：先让 AI 进行逻辑拆解，然后根据具体的步骤在一步步执行，这样会好很多。

但是现在不一样了，100 万 Token 上下文已经足够我们去理解非常大的项目代码。

除此之外，Claude 还提供了一个叫做 Context Compaction（上下文压缩） 的技术，这个技术会会自动总结并替换旧的上下文，让 Claude 能够执行更长时间的任务而不会达到限制。

这意味着什么？

这意味着：你可以把整个前端项目（src 目录 + 配置 + 文档）一次性扔给 Claude，他们通过上下文压缩方案，来逐步处理你的所有源代码。

除了这个之外，还有一个叫做 Agent Teams（代理团队） 的东西。这个和 Sunday 之前写的一篇文章有点相似，感兴趣的同学可以看看：我创建了一个全 AI 员工的一人公司

这玩意是啥意思呢？

简单来说就是：以前我们用 Claude Code，是一对一。现在，他可以直接创建出一个 Claude Code 的团队。 团队中每个人（Agent）各司其事，各自独立，并还可以相互写作，相互吵架。

Agent A（架构师）：负责拆解需求，不写代码。
Agent B（开发）：负责具体实现。
Agent C（测试）：负责写单元测试，并试图为了 Agent B 的代码找茬。

就像 claude 的更新公告在结尾所展示的一样：这次更新是解锁了新的长期任务的开始

二、 GPT-5.3 Codex

如果说 Claude 是在横向扩展（容量），那 OpenAI 的 GPT-5.3 Codex 就是在纵向钻孔（深度）。

这篇博客里最让我起鸡皮疙瘩的一句话是：

"GPT-5.3 Codex is the first model to play a key role in its own development." （GPT-5.3 Codex 是第一个在自身开发过程中发挥关键作用的模型。）

兄弟们，这剧本我看过，这就叫“左脚踩右脚上天”。

在 OpenAI 的程序员现在已经开始使用 GPT 来开发新的 GPT 了....

这意味着：目前的 AI 模型已经完全可以应用在复杂的商业项目中。

而在看完整个 GPT 5.3 的更新公告之后，Sunday 发现其中有两个点是最重要的：

1. “交互式”纠偏（Interactive Collaboration）

以前用 Agent 写代码，大家最害怕的是什么？

最怕的是它 “一条道走到黑”！

你给个需求，它跑了半小时，最后给你一坨跑不通的代码，你还不知道它是哪一步歪的。

GPT-5.3 Codex 引入了 “人机介入” 机制。

当它在构建一个复杂的 Web 游戏（比如博客里展示的那个赛车游戏）时

如果它卡住了，或者方向偏了，你可以实时暂停它，给它喂一句反馈，它能无缝接住你的思路继续干。

这解决了 Agent 落地最大的痛点：不可控性。

2. 真正的 GUI 操作能力（OSWorld 64.7%）

OSWorld 是 AI 模型中的一个专业属于，他表示的是 对视觉任务的识别程度。

通常情况下，普通人的 OSWorld 大约是在 72% 左右。

但是，这次 GPT 5.3 的更新 OSWorld 分数飙到了 64.7%。

这意味着，GPT 现在不只是只能在终端里面跑命令行了。他现在可以像人一样，打开浏览器，打开 Chrome DevTools，点击那个报错的按钮，查看 Network 面板，然后切回编辑器改代码。

这下感觉 “测试要失业了...”。之前咱们还得写个测试代码啥的，现在都已经不需要了。

我们可以直接告诉 GPT-5.3：“去把那个下单流程测一遍，如果支付失败了，截个图发我。”

它现在完全可以做到了！

三、思考总结

不知道大家看完这些升级之后是什么感觉？

Sunday 个人的感觉是：“前端又要失业了”。毕竟 2025 年前端一年就死了 10 次...

没那么严重！

不过，大家需要注意的是：如果你还是把自己定义为 “切图仔” 或者 “API 调包侠” ，那是真完了

但是，如果你把自己定义为 “产品工程师” ！那么属于你的黄金时代才刚刚开始。

为什么这么说？

1. 技术的“平权”

以前，我们要想做一个全栈应用，门槛太高了。你要懂 Docker，要懂 K8s，要懂数据库调优。

现在，GPT-5.3 Codex 连自己的训练集群都能管理。你只要有系统设计的能力，你一个人就是一个团队（AI 虽然不便宜，但是比请人可便宜多了）。

前端开发者，凭借对 用户体验（UX） 的敏感度，加上 AI 强大的后端填补能力，将成为最容易转型为“独立开发者”或“超级个体”的人群。

2. 从 “怎么实现” 到 “如何解决问题”

在以前，我们这些程序员 80% 的时间在研究 "如何去实现某一个功能"（这个效果怎么用 CSS 实现？这个状态怎么管理？）。

但是现在，不需要了。

现在，无论是 Claude 还是 GPT 都可以帮助我们去解决如何实现功能的问题。

因此，我们需要把重点改为：我们要解决什么问题？用户的痛点在哪里？系统的数据流怎么设计才合理？

在这种场景下，对用户和需求的感知力 正变的越来越重要。

最后，我想问大家一个问题：

如果明天，你不需要再写一行具体的业务代码，只需要审核 Agent 提交的 PR，你会把你省下来的这 8 个小时，用来干什么？

是去学新的技术？还是去深入理解业务？或者，去创造一个属于你自己的产品？

这才是 2026 我们思考的事情

别光看着跑分激动了。行动起来，去申请 API，去把你的 IDE 换成 Cursor 或者 Windsurf，去感受一下这种 “与硅基生物结对编程” 的感觉。

我是 Sunday。如果你在用这两个模型的过程中遇到了什么坑，或者发现了什么新玩法，随时在评论区或者群里告诉我。我们一起研究，绝不掉队。

说点不一样的。GPT-5.3 与 Claude Opus 4.6 同时炸场，前端变天了？