OpenAI Codex 大更新:Computer Use、后台 Agent、记忆系统,开发者工作流要被重写了

1 阅读3分钟

OpenAI 昨天发布了 Codex 的一次重大更新。不是小修小补 —— 是把 Codex 从一个代码助手,推向了一个能操作你电脑的通用开发 Agent。

每周 300 万开发者在用 Codex。这次更新之后,他们用的东西本质上变了。

Computer Use:AI 有了自己的光标

最引人注目的是 Background Computer Use。Codex 现在可以看到你的屏幕、点击、打字,用它自己的光标操作你 Mac 上的应用。而且是后台运行 —— 多个 Agent 并行工作,不干扰你自己的操作。

这意味着什么?前端开发者可以让 Codex 自己打开浏览器测试页面效果,而不是截图发给它看。它能操作那些没有 API 的应用。这不再是"帮我写段代码",而是"帮我把这件事做了"。

Anthropic 的 Claude 在去年就推出了 Computer Use,但一直是实验性质。OpenAI 这次直接把它做进了 Codex 桌面端,面向 300 万周活用户。规模化落地的意图很明显。

记忆系统:Agent 终于不再失忆

Codex 加入了 Memory 功能(preview)。它能记住你的偏好、之前的纠正、花时间收集的信息。下次做类似任务时,不需要你重复说明。

这解决了 AI 编程助手最大的痛点之一:每次对话都从零开始。你教它一次"我们项目用 pnpm 不用 npm",它就记住了。

更进一步,Codex 现在能主动建议工作。基于你的项目、连接的插件和记忆,它能告诉你"Google Docs 里有几条评论需要处理"、"Slack 上有个讨论跟你的 PR 相关"。从被动响应到主动规划,这是 Agent 进化的关键一步。

自动化:Agent 学会了给自己排日程

Automations 功能升级了。Codex 可以复用已有的对话线程(保留上下文),给自己安排未来的任务,自动唤醒继续长期工作 —— 跨天甚至跨周。

团队用这个功能做什么?自动合并 PR、跟进任务、监控 Slack/Gmail/Notion 上的动态。这不是 Copilot 级别的代码补全,这是 DevOps 级别的工作流自动化。

90+ 插件:连接一切

新增 90 多个插件,包括 Atlassian Rovo(JIRA 管理)、CircleCI、GitLab Issues、Microsoft Suite、Neon by Databricks、Render 等。加上内置的 MCP 支持、SSH 连接远程 devbox、多终端标签、内置浏览器 —— Codex 正在变成一个完整的开发工作站。

冷静看:边界在哪

说几个需要注意的点:

安全性。一个能操作你电脑的 AI Agent,权限边界怎么划?OpenAI 说 Computer Use 目前只在 macOS 上可用,但"后台操作你的电脑"这件事本身就需要极高的信任度。

可靠性。300 万周活用户,Computer Use 的错误率是多少?点错按钮、误删文件的概率?这些数据 OpenAI 没有公开。

锁定效应。Memory、Automations、90+ 插件 —— 用得越深,迁移成本越高。这是所有平台的经典策略。

定价。文章只说"standard API pricing, based on tokens and tool use"。Computer Use 的 token 消耗量必然远超纯文本交互,实际成本需要观察。

开发者工具的范式转移

从 GitHub Copilot 的代码补全,到 Cursor 的 AI-first IDE,再到 Codex 的桌面 Agent —— AI 开发工具的抽象层级在快速上升。不再是"帮我写这行代码",而是"帮我完成这个项目"。

这对开发者意味着什么?你的价值不再是写代码的速度,而是定义问题和验证结果的能力。 Agent 能写代码、能测试、能操作应用、能记住上下文、能自己安排工作。你需要做的是:告诉它做什么,以及判断它做得对不对。

如果你在多个 AI 模型之间频繁切换,推荐试试 OfoxAI(ofox.ai)— 一个账号搞定 Claude、GPT、Gemini 等主流模型,在不同工具和场景间灵活选择。

参考:Codex for (almost) everything - OpenAI Blog,2026-04-16