昨天晚上十一点多,正准备关电脑睡觉,手机弹了一条推送。
OpenAI 发博客了,标题叫「 Codex for (almost) everything 」。
我点进去看了两分钟,然后坐起来了。
这东西三个月前还只是个代码补全工具?现在它告诉我它能操控我的电脑、内置浏览器、生成图片、还塞了 90 多个插件?
我反复确认了两遍——这确实不是 ChatGPT 的新功能,这是 Codex 。
说实话,看完我心里挺复杂的。
一次塞了六块能力, OpenAI 这回真的不装了
Head of Codex 的 Thibault Sottiaux 说了一句很关键的话——
"Codex 是我们最能打的 agent ,它本来就跑在你的电脑上,我们只是顺着这条路继续往前走。"
然后他甩出两组数字:每周超过 300 万开发者在用 Codex ,其中 50%已经不只是拿它写代码了。
一半人已经把它当个人助理在用了。这数字看着有点吓人。
这次更新一口气加了六大块: Computer Use 、内置浏览器、图像生成、 90+新插件、记忆、自动化。
说白了——Codex 不想只帮你写代码了,它要管你电脑上的一切。
这波更新的时间点选得真够精准的。 Claude Opus 4.7 刚发没几天, OpenAI 就把大招放出来了。刀刀冲着 Anthropic 来,毫不掩饰。
36 氪上有一篇机器之心的分析文章,标题叫「更新越频繁, Claude Code 与 Codex 越像」。确实。这两家公司的产品线已经到了互相照镜子的地步。格局打开,整个 AI 编程赛道就是一场军备竞赛。但我总觉得哪里不对。
Computer Use :这招其实 Anthropic 先出的
六个能力里面最炸裂的,毫无疑问是 Computer Use 。
Codex 现在能直接操作你 Mac 上的应用。点鼠标、敲键盘、看屏幕,全套来。而且是在后台跑的,不抢你的光标。你在一个窗口里写代码,它在另一个窗口里帮你跑测试、截屏幕,互不干扰。
官方演示给了一个场景: Codex 在 Xcode 里编译了一个井字棋游戏,自己跑起来玩了一轮,发现电脑能直接下两步——定位到分支逻辑有 bug ,改掉,再跑一遍验证。
整个过程,人类没碰键盘。
有点恐怖。
但这里有个事得说清楚。
Claude 的 Computer Use 今年 3 月就上了,走的 research preview 路线。 OpenAI 的做法不一样,直接把 Computer Use 打包进 Codex ,跟其他五块能力并排放。
路径差异已经出来了。 Claude 是"我有一个 Computer Use 功能", Codex 是"Computer Use 只是我六分之一的能力"。
坦白讲,这竞争白热化到了让人窒息的程度。不过也有个尴尬的事实——目前这个功能只上了 macOS ,欧盟、英国、瑞士暂时用不了。 Windows 用户?等着吧。
而且需要装 Computer Use 插件,还要去系统设置里开 Screen Recording 和 Accessibility 两个权限。麻烦。对新手来说门槛不低。
方向已经很明确了。以后的编程工具不只是帮你写代码,它会真的坐在你旁边替你操作。说实话,这事儿想想就挺玄幻的,也有点让我后背发凉。
90 多个插件:这不是编程工具了,这是个人助理
Computer Use 是门面,插件体系可能是影响最深远的部分。
Codex 的插件是三样东西的组合: skills (任务说明书)、 app integrations (应用权限和接口)、 MCP servers (后端数据和工具源)。这次一口气加了 90 多个。
被官方点名的包括 Atlassian Rovo (管 JIRA 的)、 CircleCI 、 CodeRabbit 、 GitLab Issues 、 Microsoft Suite 、 Superpowers 等等。
演示里给了一条 prompt 特别有意思:
"Can you check Slack, Gmail, Google Calendar, and Notion and tell me what needs my attention?"
一条命令,横穿四个插件,让 Codex 帮你做每天早上的 standup 。
这已经不是编程了。你让一个"代码工具"去查你的邮件、日历、 Slack 消息——跟请了个秘书有什么区别?
关键是插件之间还有优先级排序。你让 Codex 做一件跨工具的事,它会从插件库里按排序决定谁先上。
生态位之争,正在这里发生。说真的,我有点慌。你确定要让一个 AI 同时读你的 Slack 消息、 Gmail 邮件和 Notion 笔记?这安全吗?出了 bug 谁负责?
卷不动了。真的。
记忆+自动化: Codex 开始有"时间感"了
Memory 比较好理解, Codex 会记住你的偏好、你改过的地方、你上次花了半天才解释清楚的技术背景,下次直接省掉。
Automations 才是真正值得注意的。
以前的自动化就是定时跑个脚本。这次有变化:自动化任务可以沿用一个已经跑过一轮的对话线程,把之前的上下文带进去继续。一个 Automation 可以给自己安排几天后的下一次触发,也可以跨周执行。
有人在用它做 PR babysitter ,盯着团队里没合上的 PR 。有人在用它做 Customer feedback monitor ,跨 Slack 、 Gmail 、 Notion 三个渠道盯客户反馈。
不过这些功能目前先给美国用户。欧盟、英国、教育版、企业版得等。地域限制这个老毛病, OpenAI 一直没改。
说回趋势。
最近半年放在一起看——Claude 先上了 Computer Use , OpenAI 跟进; Claude 推出了 MCP 协议, OpenAI 也搞插件体系;两家都在往"不只是写代码"的方向走。
36 氪那篇分析说得对:底层大模型的同质化,必然导致上层应用趋同。两家公司在二级市场估值咬得非常紧。资本的嗅觉最灵敏,在他们眼里,两只独角兽正在长出相同的犄角。
这场仗打到终局,难受的是那些还在犹豫要不要上车的开发者。不上车吧,效率差一个量级;上车吧,又怕被 AI 牵着鼻子走。进退两难。
还有一些容易被忽略的
六块大能力之外,还塞了些小功能。
PR 评审——Codex 能识别 GitHub PR 上同事写的 review comments ,逐条处理。多终端标签——在 Codex 里开多个终端并行跑。 SSH 连接远程 devbox——可以把 Codex 挂到远程开发机上, alpha 阶段。
侧栏文件预览特地被强调了。 Codex 开始接一种"给非开发者看的产品交付物":跑一个 agent 生成 xlsx 或 pdf ,能直接打开、截图、发给人。
以后不写代码的人也能用 Codex 了。生成报表、做数据分析、输出文档——这些以前需要找开发帮忙的活儿,一个 prompt 就搞定了。
等等。这对程序员来说是个坏消息吧?
开发者该怎么办
说句可能不太受欢迎的话——AI 编程工具的竞争,对我们来说不完全是坏事。
Claude Code 和 Codex 越是趋同,越是互相卷功能,用户得的好处越多。 300 万周活开发者,可能半年后就是 1000 万。当所有人都在用 AI 写代码,差异化的价值反而回到了人身上——架构判断、需求理解、跨领域联想,这些 AI 暂时还替代不了。
但我真的不确定。
50%的用户已经不只是拿 Codex 写代码了。当一个编程工具开始帮你管日程、查邮件、盯 PR ,它不再只是工具。它在渗透你工作的每一个环节。
便利和控制的边界,到底在哪里?
也许半年后回头看才有答案。也许根本没有。
不过有一件事我现在就可以做——把 Codex 的更新日志再看一遍,看有没有漏掉什么。
不想被 AI 取代的第一步,就是先搞清楚 AI 到底进化到了什么程度。