当你看到 GPT-5.4-Thinking 和 GPT-5.4 Pro 发布之后,可以准备取消你的 Claude Code 订阅了! 不用再花高昂的费用还要受 A 社 的封号折磨了!
另外,大家都听过 🦞 OpenClaw, 而 GPT-5.4 简直就是 OpenClaw 的天选模型!
前段时间 OpenClaw 创始人 Peter Steinberger 已加入 OpenAI,可以看出 OpenAI 把部分重心放在了 Computer Use Agent 方向。
但这次 GPT-5.4 的表现确实比之前的提升了很多,比如有了 1M 的上下文。 Agent tool use 的评分甚至超过了 Claude Opus 4.6。
GPT-5.4 目前发布了 Thinking + Pro 两个版本,并且上线 ChatGPT Web、API 和 Codex。
GPT-5.4 Thinking 可以先给出一个前置计划,让用户在它执行过程中及时纠偏;在 API 和 Codex 里,它又具备原生 computer use、长上下文和更强工具搜索能力。
如果说过去几代大模型的竞争,核心是“更聪明、更会写、更会答”,那么 GPT-5.4 的信号已经明显变了。
OpenAI 在官方发布里直接把它定义为“为专业工作设计”的前沿模型,并且强调它把最近几轮最关键的进步:推理、Coding、Agent 工作流、工具调用、电脑操作 都合成到了 GPT-5.4 模型里。
GPT-5.4 到底做了什么系统整合?
GPT-5.4 很强的地方,不只是某一项 benchmark 拉高了多少,而是 OpenAI 这次把几条原本分散的能力线收束到一起了。
官方写得很明确:GPT-5.4 继承了 GPT-5.3-Codex 的 coding 能力,同时提升了跨工具、跨软件环境、跨专业任务的表现;还支持最多 1M token 上下文,并通过 tool search 在大规模工具生态里更高效地找到和调用正确工具。
它在 SWE-Bench Pro 上表现可匹敌甚至超过 GPT-5.3-Codex,同时在推理过程中延迟更低。
用户不再需要反复判断:“这件事该用聊天模型、编程模型、agent 模型,还是另一个专门工具?”
OpenAI 想做的显然是让同一个模型覆盖越来越多的专业场景,这比单个榜单第一还重要。
因为真正推动 AI 进入企业预算的,从来都不是 demo,而是可集成、可复用、可交付。
GPT-5.4 和 Opus 4.6 到底有什么区别?
GPT-5.4 瞄准的方向是“全都干的专业工作模型”,而 Opus 4.6 像是“超强长程推理与 coding/agent 模型”。
Anthropic 对 Claude Opus 4.6 的官方表述非常明确:它们强调的是 Opus 4.6 在复杂多步骤任务、长 coding、agentic planning、长上下文稳定性和复杂研究工作上的跃升。
OpenAI 的主要是:推理 + coding + computer use + knowledge work + tools。
也就是说,把文档、Excel 表格、PPT、代码、网页操作、工具调用放进同一个工作系统里。
Anthropic 的主要是:长程任务、复杂推理、agent 规划、长上下文稳定、复杂 coding。
它特别强调模型会更主动拆任务、并行调用子任务、在长 session 中保持产出质量,并且在复杂代码库与研究工作里表现更像资深协作者。
对于 GPT-5.4 和 Opus 4.6 使用场景来选的话:
如果你在意的是:文档、表格、PPT、研究、工具调用、浏览器/桌面操作、Coding 全部想交给一个统一模型来做,GPT-5.4 的路线更完整。
如果你在意的是:复杂 coding、长程 agent、长上下文稳定、复杂研究链路、大代码库处理,Opus 4.6 很可能更对味。
也就是如果你最近都在用 OpenClaw 的话,GPT-5.4 无疑是当前最好的选择,很符合模型的一个使用场景。
GPT-5.4 和 OpenClaw 结合
单看 GPT-5.4,你会觉得它更强了。
单看 OpenClaw,你会觉得 Agent 更火了。
但如果把这两件事合起来看,问题就变成了:
一个更会推理、更会 Coding、更会调用工具、更会操作电脑的模型,如果装进一个能持续运行、能管理 skills、能接触本地环境的 Agent 外壳里,会发生什么?
答案大概是:AI 会从“内容生成器”变成“任务执行器”。
未来最有价值的 AI,不一定是最会说的那个,而是最能进入真实工作流、拿到权限、调动工具并交付结果的那个。
OpenAI 在 GPT-5.4 上强化 computer use,不只是为了做一个 agent 功能。
它在 OSWorld-Verified 和 BrowseComp 这类更接近真实任务执行的评测上提升明显,说明模型已经被训练去理解界面、采取动作、完成链路。
而 OpenClaw 刚好提供了一种大众能理解的表达:让 AI 不再只待在聊天框里,而是进入文件、浏览器、消息通道和本地工具链。
所以 GPT-5.4 和 OpenClaw 组合一起,可以比作为:AI 的“脑”和“手”,正在汇合。
如何才能使用 OpenClaw 呢?
Claude 和 Gemini 都禁止了在 OpenClaw 中使用,而且 Claude 授权使用 OpenClaw 的话,简直就是在烧钱,除非你可以成功开通 Max 会员(并且不封)。
毕竟 OpenClaw 创始人已经去了 OpenAI,所以还得是 ChatGPT 的 Codex。(不用担心封,只要Codex更新,还会给你突然重置额度)
最划算,优惠的方式就是 在 OpenClaw 通过授权 Codex 进行登录你的 GPT 账号就可以使用。只要你是 GPT 会员(Plus、Business、Pro)就可以用这个方式。
不知道国内怎么去开通 GPT 会员的话,你可以使用这个官网,正规渠道用了很久,一键升级,小白都会。
最后
很多人看模型发布,习惯问一句:“它比上一代强多少?”
但 GPT-5.4 更值得问的问题其实是:它把哪些原本分散的能力,第一次组织成了一个可工作的整体?
个人觉得 GPT-5.4:它不是在继续优化聊天体验,而是在重新定义什么叫“模型交付能力”。
如果说过去两年,AI 产业最核心的问题是“模型够不够聪明”; 那么从 GPT-5.4 到 OpenClaw,这个问题正在换成另一个更现实的问题:
当 AI 既足够聪明,又开始拥有手脚,我们到底准备好把多少工作交给它?