昨晚老金我准备关电脑的时候,群里突然冒出一句:老金,Claude Code 和 Codex 到底该用哪个?
我手都放到键盘上了,第一反应是给一个很省事的答案。
工程师多用 Claude Code,产品经理、小团队老板可以试 Codex。字打到一半,我又删了。
不能说这句话错了,而是它不像在给不会的人讲,而是在给明白的人讲你直接用就行了。
过了一会儿,群里另一个朋友补了一句。
他说自己喜欢 Claude Code,因为它在项目里翻文件、改代码、跑测试的时候,人能在旁边看着。哪里不对,马上喊停。
另一个做产品的朋友立刻接话,说他不想看这些过程。他手里一堆小需求,最好是把任务交出去,过一会儿回来看看改了哪些文件、能不能收。
这一下老金我反而觉得问题清楚了。
他们不是在争 Claude Code 和 Codex 谁更强。
他们是在问两种完全不同的工作位置。一个人想陪 AI 进现场,一个人想把活儿派出去。
老金我换一个小白更容易看懂的例子,不碰现有产品,也不从修改代码开始。
假设你现在开了一个空文件夹,想让 AI 帮你做一个“周末露营活动报名页”。不是上线系统,就是一个能打开看的网页原型。朋友看完能知道时间、地点、费用、行程安排,也能看到一个报名表单长什么样。
老金我建议你先别急着选工具,直接用一个三步判断法。
第一步,先问这个任务我需要看过程吗?
如果你需要和 AI 一边看方案一边改,比如想先看看页面分几块、风格是不是对、报名表单要不要加微信号,那就更适合放在 Claude Code 这类现场工具里做。你要的是边看边调,不是一次性丢出去等结果。
第二步,再问这个任务的边界清楚吗?
如果边界已经清楚,比如就做一个单页网页,只要一个 index.html,内容模块你也列好了,那就可以考虑派给 Codex 这类后台任务流。你不需要盯它怎么写每一段,你要的是回来以后能直接打开文件验收。
第三步,最后问我能不能验收?
这一步最现实。你不懂代码没关系,但你至少要知道做完以后看什么。页面能不能打开,手机上会不会挤,报名表单有没有姓名、电话、人数,按钮是不是明显,这些都是普通人能验收的东西。
所以这个例子里,任务不是“帮我做个页面”这么一句话。
如果你把这句话直接扔给 AI,它大概率会自己猜。它可能做成公司官网,可能做成旅游海报,也可能写一堆你看不懂的框架文件。最后你打开文件,发现好像能看,但不是你想要的那个报名页。
放到 Claude Code 里,老金我会这样写:
我想做一个“周末露营活动报名页”的网页原型。先不要创建文件。
请先看一下当前目录,然后告诉我你准备做几个文件、页面会分成哪几块、需要我确认哪些内容。
页面要给普通朋友看,包含活动标题、时间地点、费用、行程安排、报名表单和注意事项。风格清爽,手机和电脑都能看。
等我确认方案后,你再生成一个可以直接打开的 index.html。
为什么要这么发?
因为你现在还没想清楚页面长什么样。到底要不要报名人数?要不要集合地点?要不要写装备清单?要不要做成卡片风格?这些不是技术问题,是你的取舍问题。
Claude Code 这条路线,第一轮最好不要直接产出文件。你让它先把页面方案摊开,比如顶部放活动名,中间放时间地点和费用,下面放行程,再下面放报名表单。你看一眼就能说,费用要不要放前面,行程要不要更简单,报名表单要不要加微信。
你确认以后,再让它生成 index.html。生成完以后,你可以继续在现场追一句:把标题再口语一点,按钮改明显一点,手机上第一屏不要太挤。这个过程很像你坐在旁边改稿,不是一次性把需求扔出去。
这条路线最后的结果,不只是一个文件。你还会得到一段你能看懂的过程,知道它为什么这样排版、哪些地方你刚刚确认过、下一步还能怎么改。你截图的时候,也可以截到它先问方案、再动手生成的过程。
放到 Codex 里,我会写得更像派单:
请在当前空目录创建一个“周末露营活动报名页”网页原型。
目标:生成一个可以直接在浏览器打开的 index.html。
范围:只做一个静态单页,不接后台,不使用外部图片,不需要安装依赖。
内容:活动标题、时间地点、费用、行程安排、报名表单、注意事项。
验收:打开 index.html 后,手机和电脑都能正常阅读;报名表单包含姓名、电话、人数、备注;底部有一个醒目的“我要报名”按钮。完成后告诉我生成了什么文件、怎么打开、你做了哪些设计取舍。
为什么 Codex 这里反而要这么写?
因为你不准备陪它慢慢定方案,就要把任务卡写得更像交付单。目标是什么,范围到哪里,验收看什么,全部提前写清楚。你不能只写“帮我做个报名页”,那不是派单,那是许愿。
Codex 这条路线,理想过程是它自己创建文件、写页面、整理结果,然后告诉你怎么打开。你不需要盯着它每一步怎么写,但你回来验收时要看得很硬。
第一,看范围有没有越界。它有没有生成一堆你没要的工程文件?有没有引入外部图片?有没有要求你安装依赖?如果有,先打回。
第二,看内容有没有完整。标题、时间地点、费用、行程、报名表单、注意事项,少一个都不算完成。
第三,看打开效果。电脑上能不能看,手机上会不会挤,按钮是不是明显,表单字段是不是够用。Codex 的优势是能把一个清楚的小活直接做完,但前提是你知道回来以后看哪几项。
这就是两种工具真正的差别。
Claude Code 更像你把 AI 拉到工位旁边,边看边问,边改边收。它适合那些你还没想清楚、需要现场调整、随时想改口味的活。
Codex 更像你把一张任务卡丢进队列,等它带着结果回来。它适合那些边界已经写清楚、验收点能列出来、你不需要盯每一步的小活。
它们都能帮你做出网页,但你给任务的方式不一样。
Claude Code 的重点是过程可控,Codex 的重点是结果可收。
这两个位置差得很远。
按 2026 年 5 月 21 日能查到的官方资料看,Claude Code 已经不是单纯的终端工具了。
Anthropic 的 overview 里说,它是一个 agentic coding tool,可以读代码库、改文件、跑命令,并且已经覆盖 terminal、IDE、desktop app 和 browser。它的 changelog 也还在密集更新,说明这东西不是停在某个发布页上的老概念。
Codex 这边也变了。OpenAI 今年推的是 Codex app 和 Codex cloud 这一整套。
官方说法里,重点是多个 agent 并行、长任务、云端环境、集中看 diff,最近还把 Codex 放进了 ChatGPT mobile,让你在手机上也能盯着任务跑。
所以如果只写一张表,说 Claude Code 偏现场、Codex 偏委托,当然也能讲。
但那张表解决不了真正的问题。你得先看自己手里的活,脏不脏、边界清不清、能不能验收。
真正的问题是,你现在到底会不会安排 AI 干活。
上面那个露营报名页例子,其实就是最常见的一类人,我叫他 许愿型用户。
他打开工具以后,第一句话通常是:帮我做个活动页。帮我做得好看一点。帮我搞一个报名页面。
你看,这些话都不像废话。它们有方向,有情绪,也确实像需求。
问题是,AI 接到的不是任务,而是一团愿望。
做活动页,做成什么样?给谁看?是海报感强一点,还是信息清楚一点?要不要报名表单?表单里要姓名、电话、人数,还是还要备注?手机上第一屏要看到什么?
这些不说,AI 也不会坐下来跟你开需求评审会。
它会猜。而且它会很认真地猜。
这才麻烦。
如果对你有帮助,记得关注一波~
以前人和人协作,需求模糊,最多开会扯皮。
现在你把模糊需求交给 AI,它不会扯皮,它会直接开工。十分钟以后,一个看起来还挺完整的结果就回来了。有标题,有卡片,有按钮,也能在浏览器里打开。
最容易骗过人的,就是这种半成品。
因为它不是空白。它看起来像成果。
许愿型用户最该补的,不是换工具,而是把一句愿望改成一段任务。刚才那两段提示词,本质上就是在做这件事。
目标是什么,页面给谁看,必须包含哪些内容,做完怎么看算合格。四件事写出来,AI 才开始有机会做对。
这时候你再问 Claude Code 还是 Codex,答案才有意义。
第二类人,我叫 现场型用户。
这种人通常是工程师,或者至少能看懂项目结构。
他不太相信一句话把任务扔出去就完事。他想看 AI 怎么找文件、为什么改这里、准备跑哪个测试、有没有碰到不该碰的地方。
他不是不信 AI。他是不信复杂项目里有那么多干净问题。
老项目里很多东西都不是写一个函数这么简单。
一个接口为什么没人敢动,一个配置为什么只在本地能跑,一个测试为什么红了很久,一个组件为什么看起来能删但没人删,这些东西不在需求文档里。
他们在现场。
所以现场型用户用 Claude Code 会更顺,不是因为 Claude Code 永远比 Codex 聪明,而是它离现场近。
你能让它读项目、改文件、跑命令、解释影响范围。它刚准备往危险地方伸手,你能马上让它停一下。
这类人的升级动作,不是让 AI 多写代码。是更早地逼它说清楚为什么。
先讲改动路径,再动手。先跑最小验证,再扩大范围。先告诉我会影响哪些文件,再下刀。
这不是监工思维。
真正的现场协作,是你守住判断口,AI 负责把脏活往前推。
第三类人,我叫 派单型用户。
这类人不想蹲在现场,也不应该每件事都蹲在现场。
产品经理、小团队负责人、创业者很容易到这个位置。手里不是一个任务,而是一排小推进。
改一个后台字段。补一个错误状态。给落地页加一个表单。把某个接口返回接到现有组件里。
这些事情你每个都陪 AI 走全程,时间也没省多少。
Codex 这类云端和多 agent 工作方式,对这类人就很有吸引力。OpenAI 的 Codex web 文档说得很直接,Codex 可以在 cloud environment 里后台跑任务,也能并行处理。Codex app 又把多个 agent、长任务和 diff 集中到一个工作台里。
这听起来很爽。
但派单型用户最容易犯的错,是把能跑当成能收。
页面打开了,不代表流程对。按钮能点,不代表权限没破。测试绿了,不代表业务边界没被改穿。
这类人真正要练的,是验收口。
你不一定看它每一步,但你要知道回来以后看哪几件事。改了哪些文件,哪些测试必须跑,哪些流程不能断,哪些地方不能自作主张。
没有验收口的派单,最后还是许愿。
只不过这次愿望跑得更快。
还有一类人更进一步,我叫 调度型用户。
他已经不太问哪个工具更强了。他会先看任务。
这个问题脏不脏?边界清不清?失败成本高不高?结果好不好验收?
如果是老项目里的疑难 bug,问题还没看清,他会让 AI 留在现场,边查边解释。
如果是边界清楚的小功能,他会把任务拆好,派出去跑一版。如果是一个大方向,他不会直接开工,而是先让 AI 做代码库摸底、方案对比、风险点列表。
你发现没有,到了这一档,Claude Code 和 Codex 就不是二选一了。
它们变成两种动作。
现场不清楚,就靠近现场。边界清楚,就派出去。结果不确定,就先问方案。风险高,就别急着让它改。
这才是 AI 编程真正的分水岭。
不是你会不会写代码,而是你会不会把代码生产这件事拆成不同的工作方式。
AI 确实把很多人从空白文档里拉出来了。以前你不会写代码,一个想法可能只能停在 Notion 里。现在你可以先搭一版,先看到东西,再慢慢改。
但它也很容易把人带沟里。
因为 AI 降低了写代码的门槛,同时抬高了定义任务的门槛。
以前你说不清楚,团队会追问你。
现在你说不清楚,AI 可能先给你做出来。然后你看着那个半成品,一边觉得厉害,一边不知道哪里不对。
这才是最消耗人的地方。
你以为自己在验收代码,其实是在补一开始没有想清楚的目标。
所以如果你现在问老金我,Claude Code 和 Codex 怎么选,我会先让你报个位置。
如果你还是许愿型,先别纠结工具。
把“帮我优化一下”改成“我要解决什么问题,不能动什么,怎么验收”。
这一步不过,换哪个都容易翻车。
如果你是现场型,Claude Code 这类贴近项目的方式会更舒服。
你要的是边看边改,边跑边判断,关键时刻能喊停。
如果你是派单型,Codex 这类能后台跑、并行跑、集中看结果的方式会更顺。
但前提是你会写边界和验收口。
如果你已经是调度型,就别把自己绑死在一个工具上。
你真正要设计的是工作流。什么任务留在现场,什么任务派出去,什么任务先问方案,什么任务宁愿慢一点也不能让 AI 自己猜。
讲到底,AI 编程不是把人从项目里拿掉。它是把人逼到更关键的位置上。
你不一定要亲手写每一行代码,但你要知道目标是什么,边界在哪里,结果怎么收,什么时候该停。
工具会越来越强,也会越来越像。
真正拉开差距的,可能不是谁先装了 Claude Code,谁先打开 Codex。
而是同样一句“帮我做一下”,有的人交出去的是愿望,有的人交出去的是任务。
飞书****开源知识库(实时更新 交流群):
https://tffyvtlai4.feishu.cn/wiki/OhQ8wqntFihcI1kWVDlcNdpznFf
Claude Code & Openclaw 双顶流全中文从零开始的教程:不懂代码照样造网站,老金15万字Claude Code+OpenClaw教程免费开源
每次我都想提醒一下,这不是凡尔赛,是希望有想法的人勇敢冲。
我不会代码,我英语也不好,但是我做出来了很多东西。
我真心希望能影响更多的人来尝试新的技巧,迎接新的时代。
谢谢你读我的文章。
如果觉得不错,随手点个赞、在看、转发三连吧🙂
如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章。