两个编程神器:Claude 和 ChatGPT 又更新啦 ~
就在凌晨2点时, Claude Opus 4.6 发布了,但是被 OpenAI 阻击了,不到 20 分钟的时间,就甩出了 GPT-5.3-Codex,号称迄今为止最强的代理式编程(agentic coding)模型。
就像一位同事一样,你可以在 GPT-5.3-Codex 工作时引导和与之互动,而不会丢失上下文。
前两天 Claude 就是要发布新模型,但是更新之后,貌似崩了,紧急撤回了更新。
早在几个月前我的主力就切换到 Codex,虽然 Codex 比较慢,最近也提速了不少。Codex 慢是慢,但是它准! 基本我平时增加功能时,都是一次性过,并且 0 BUG。
目前 GPT-5.3-Codex 只有付费计划用户才能使用,只要你有 Plus、Business、Pro等会员就可以使用。
没有会员的,可以到GPT一键升级系统上,开通一个几十块的 Business 会员就可以使用 Codex 啦,而且额度是跟 Plus 一致,高性价比体验会员。
Claude Code 快是快,但是副作用太大了,编译和运行时,报错的概率比较大,需要再次修复。 不过 Claude Code 的生态比较好,偶尔还是会使用 Claude Code, 主要 Claude Code 太贵,太耗token了。
而且这次 GPT-5.3-Codex 的更新有点不一样,消耗的 token 更少了,并且准确性也更高了。
最主要的是 GPT-5.3-Codex 是 OpenAI 首个自我创造的模型。
GPT-5.3-Codex 会在完成了网页的生成后,不会立马停止,它会通过 npx 安装了一个渲染库,渲染了自己刚刚构建的页面,并将与我的上下文提供的参考图进行了比较。
然后会进行一个自我修正。
而在一些基准方面的测试,每个模型的基准测试都是不一样的细节,目前 GPT-5.3-Codex的编程(Terminal-Bench 2.0)分数高于 Claude Opus 4.6,但是最终还是自己去体验之后,才能明确知道哪个模型更适合自己日常开发。
Claude Opus 4.6 的基准测试看起来分数都挺高,但是细看一下每项的测试细节和标准,都是不一样的。
Claude 的生态比较好,比如你处理一下 Excel、PPT 之类的,它调用 mcp 和 computer use 的能力都比较强,效果都会比较好。
在编程方面的话,目前我还是选择 Codex,不会封号,而且便宜!
如果没有收到 GPT-5.3-Codex 的推送,需要更新一下你的 Codex 插件 或者 Codex APP,就可以看到对应的模型啦