OpenAI Codex 大更新:Computer Use、浏览器、Memory 全面上线

8 阅读3分钟

OpenAI 在 4 月 16 日发布了 Codex 的一次重大更新。这不是小修小补 — 而是把 Codex 从一个"代码助手"推向了"全栈开发 Agent"的位置。Computer Use、内置浏览器、图片生成、Memory、90+ 插件,一次性全上。

作为每天都在用各种 AI 编码工具的开发者,这次更新值得认真拆解。

Computer Use:Agent 终于能"看见"你的屏幕了

Codex 现在可以在后台操作你的 Mac — 看屏幕、点鼠标、打字,用自己的光标。多个 Agent 可以并行工作,不干扰你在其他应用里的操作。

这意味着什么?以前 Agent 只能在终端和编辑器里干活,遇到没有 API 的应用就抓瞎。现在它可以直接操作 GUI — 测试前端页面、操作设计工具、甚至在浏览器里跑 E2E 测试。

不过目前仅限 macOS,Windows 还在路上。而且"看屏幕"这件事的准确率和延迟,实际体验如何还需要观察。Anthropic 的 Claude Computer Use 已经先行一步,OpenAI 这次算是补上了这块拼图。

内置浏览器 + 图片生成:前端开发闭环

Codex 内置了浏览器,你可以直接在页面上标注、评论,给 Agent 精确的视觉指令。配合 gpt-image-1.5 的图片生成能力,从设计稿到代码到预览,整个前端开发流程可以在一个窗口里完成。

对前端和游戏开发者来说,这是实打实的效率提升。以前你需要在编辑器、终端、浏览器之间反复切换,现在 Agent 可以改代码 → 看效果 → 继续改,形成真正的闭环。

Memory + 自动化:Agent 开始有"记忆"了

这次更新中我最关注的是 Memory 功能。Codex 现在可以记住你的偏好、之前的纠正、以及花时间收集的上下文信息。这意味着 Agent 不再是每次对话都从零开始 — 它会越用越懂你。

更有意思的是自动化能力的升级:Codex 可以复用已有的对话线程保持上下文,甚至可以给自己安排未来的任务,跨天甚至跨周持续工作。这已经不是"工具"的范畴了,更像是一个有持续性的数字同事。

90+ 插件:从写代码到管项目

新增的插件覆盖了开发者日常工具链:Atlassian Rovo(管 JIRA)、CircleCI、GitLab Issues、Neon、Render 等。加上 SSH 连接远程开发环境、多终端标签、PR Review 评论处理,Codex 正在把自己定位成开发者的统一工作台。

冷静看:这是方向,但还不是终局

OpenAI 的野心很明确 — 让 Codex 成为开发者的"操作系统级"工具。但几个问题值得关注:

  1. Computer Use 的可靠性。GUI 操作比 API 调用脆弱得多,误操作的风险不可忽视
  2. Memory 的隐私边界。Agent 记住的东西越多,数据安全的要求就越高
  3. 插件生态的质量。90+ 听起来很多,但关键是每个插件的深度和稳定性

目前 Codex 每周有 300 万开发者在用。这次更新把它从"代码补全工具"推向了"全流程开发 Agent"。方向是对的,但 Agent 真正替代人类开发者的日常工作流,还需要在可靠性上再跨一个量级。


如果你在多个 AI 模型之间频繁切换做开发,推荐试试 OfoxAI(ofox.ai)— 一个账号搞定 Claude、GPT、Gemini 等主流模型,省去多平台管理的麻烦。