说点不一样的。GPT-5.3 与 Claude Opus 4.6 同时炸场,前端变天了?

0 阅读7分钟

大家好,我是 Sunday。

早上一起来,手机就被刷屏了...各大号主都在写 OpenAI 和 Anthropic 在昨天晚上发布的最新模型 GPT-5.3-CodexClaude Opus 4.6

我看了一眼各大号主的文章,发现大家都在狂欢(真假不重要,至少文章中都在狂欢),都在发跑分截图。有的说 Claude 的 一百万(1M)上下文无敌 了,有的说 GPT-5.3 的 OSWorld 分数太吓人。

Claude 提供百万上下文

GPT-5.3 的 OSWorld 跑分

但是,Sunday 作为一个写了十几年代码、现在天天琢磨怎么用 AI 提效的“老前端”。看了这两篇长达数万字的技术文档之后,却并没有其他博主反应的那么兴奋。

为什么呢?

因为,Sunday 发现在这两篇文章中,顶级 AI 模型目前争论的焦点,已经完全不是“谁写的代码 Bug 少”这么简单了,他们正在重新定义什么是“写代码”?

所以,今天这篇文章,Sunday 就我不带大家像看热闹一样去比那些虚无缥缈的跑分(虽然跑分都很高),我想带大家从另外一个角度,来看看这次更新的核心内容。或许大家看完之后,能有不一样的收获。

一、 Claude Opus 4.6

先说 Anthropic 的 Claude Opus 4.6

大家都在吹 100 万 Token 上下文(1M Context)

很多人对这个数字没概念,觉得不就是:“可以把一个超级大的文档扔给 Claude 让他处理了吗?”

错。大错特错。

想要明白这个,我们需要先知道 AI 写代码到底是怎么去写的!

在 Opus 4.6 之前,我们用 AI 写代码是 “切片式” 的。

什么意思呢?

比如:你的项目可能有 500 个文件,但你每次只能复制粘贴那 3 个相关的文件给 AI。 AI 每次也只是读取其中的部分文件的部分代码。简单理解就是:AI 是看不见的全局架构设计的。它看不见你的隐藏依赖、架构设计方案、更不了解你 CSS 中可能会存在的全局污染问题。

所以,AI 经常会写出那种 “局部完美,全局崩盘” 的代码。

之前我们的处理方式都是:先让 AI 进行逻辑拆解,然后根据具体的步骤在一步步执行,这样会好很多。

但是现在不一样了,100 万 Token 上下文已经足够我们去理解非常大的项目代码。

除此之外,Claude 还提供了一个叫做 Context Compaction(上下文压缩) 的技术,这个技术会会自动总结并替换旧的上下文,让 Claude 能够执行更长时间的任务而不会达到限制。

这意味着什么?

这意味着:你可以把 整个 前端项目(src 目录 + 配置 + 文档)一次性扔给 Claude,他们通过上下文压缩方案,来逐步处理你的所有源代码。

除了这个之外,还有一个叫做 Agent Teams(代理团队) 的东西。这个和 Sunday 之前写的一篇文章有点相似,感兴趣的同学可以看看:我创建了一个全 AI 员工的一人公司

这玩意是啥意思呢?

简单来说就是:以前我们用 Claude Code,是一对一。现在,他可以直接创建出一个 Claude Code 的团队。 团队中每个人(Agent)各司其事,各自独立,并还可以相互写作,相互吵架。

  • Agent A(架构师):负责拆解需求,不写代码。
  • Agent B(开发):负责具体实现。
  • Agent C(测试):负责写单元测试,并试图为了 Agent B 的代码找茬。

就像 claude 的更新公告在结尾所展示的一样:这次更新是解锁了新的长期任务的开始

二、 GPT-5.3 Codex

如果说 Claude 是在横向扩展(容量),那 OpenAI 的 GPT-5.3 Codex 就是在纵向钻孔(深度)。

这篇博客里最让我起鸡皮疙瘩的一句话是:

"GPT-5.3 Codex is the first model to play a key role in its own development." (GPT-5.3 Codex 是第一个在自身开发过程中发挥关键作用的模型。)

兄弟们,这剧本我看过,这就叫“左脚踩右脚上天”。

在 OpenAI 的程序员现在已经开始使用 GPT 来开发新的 GPT 了....

这意味着: 目前的 AI 模型已经完全可以应用在复杂的商业项目中。

而在看完整个 GPT 5.3 的更新公告之后,Sunday 发现其中有两个点是最重要的:

1. “交互式”纠偏(Interactive Collaboration)

以前用 Agent 写代码,大家最害怕的是什么?

最怕的是它 “一条道走到黑”!

你给个需求,它跑了半小时,最后给你一坨跑不通的代码,你还不知道它是哪一步歪的。

GPT-5.3 Codex 引入了 “人机介入” 机制。

当它在构建一个复杂的 Web 游戏(比如博客里展示的那个赛车游戏)时

如果它卡住了,或者方向偏了,你可以实时暂停它,给它喂一句反馈,它能无缝接住你的思路继续干。

这解决了 Agent 落地最大的痛点:不可控性

2. 真正的 GUI 操作能力(OSWorld 64.7%)

OSWorld 是 AI 模型中的一个专业属于,他表示的是 对视觉任务的识别程度

通常情况下,普通人的 OSWorld 大约是在 72% 左右。

但是,这次 GPT 5.3 的更新 OSWorld 分数飙到了 64.7%

这意味着,GPT 现在不只是只能在终端里面跑命令行了。他现在可以像人一样,打开浏览器,打开 Chrome DevTools,点击那个报错的按钮,查看 Network 面板,然后切回编辑器改代码。

这下感觉 “测试要失业了...”。之前咱们还得写个测试代码啥的,现在都已经不需要了。

我们可以直接告诉 GPT-5.3:“去把那个下单流程测一遍,如果支付失败了,截个图发我。”

它现在完全可以做到了!

三、 思考总结

不知道大家看完这些升级之后是什么感觉?

Sunday 个人的感觉是:“前端又要失业了”。毕竟 2025 年前端一年就死了 10 次...

没那么严重!

不过,大家需要注意的是:如果你还是把自己定义为 “切图仔” 或者 “API 调包侠” ,那是真完了

但是,如果你把自己定义为 “产品工程师” !那么属于你的黄金时代才刚刚开始。

为什么这么说?

1. 技术的“平权”

以前,我们要想做一个全栈应用,门槛太高了。你要懂 Docker,要懂 K8s,要懂数据库调优。

现在,GPT-5.3 Codex 连自己的训练集群都能管理。你只要有系统设计的能力,你一个人就是一个团队(AI 虽然不便宜,但是比请人可便宜多了)。

前端开发者,凭借对 用户体验(UX) 的敏感度,加上 AI 强大的后端填补能力,将成为最容易转型为“独立开发者”或“超级个体”的人群。

2. 从 “怎么实现” 到 “如何解决问题”

在以前,我们这些程序员 80% 的时间在研究 "如何去实现某一个功能"(这个效果怎么用 CSS 实现?这个状态怎么管理?)。

但是现在,不需要了。

现在,无论是 Claude 还是 GPT 都可以帮助我们去解决如何实现功能的问题。

因此,我们需要把重点改为:我们要解决什么问题?用户的痛点在哪里?系统的数据流怎么设计才合理?

在这种场景下,对用户和需求的感知力 正变的越来越重要。

最后,我想问大家一个问题:

如果明天,你不需要再写一行具体的业务代码,只需要审核 Agent 提交的 PR,你会把你省下来的这 8 个小时,用来干什么?

是去学新的技术?还是去深入理解业务?或者,去创造一个属于你自己的产品?

这才是 2026 我们思考的事情

别光看着跑分激动了。行动起来,去申请 API,去把你的 IDE 换成 Cursor 或者 Windsurf,去感受一下这种 “与硅基生物结对编程” 的感觉。

我是 Sunday。如果你在用这两个模型的过程中遇到了什么坑,或者发现了什么新玩法,随时在评论区或者群里告诉我。我们一起研究,绝不掉队。