这是一期Codex零基础保姆级教程。
接下来我会手把手帮你从入门到精通Codex。
包括Codex的安装、Codex的基础功能、Codex的核心玩法、怎么用Codex完成日常办公,以及怎么使用Codex全自动搭建并上线一个属于你自己的网站等等。
那废话不多说,我们正式开始。
01 Codex 是什么?
Codex 是OpenAI专门做的一款 AI 智能体工具。
注意我没说"AI 编程工具"——虽然它确实是从编程出发的。
但现在它已经进化成了一个能帮你干各种工作的全能助手:写代码、做 PPT、做 Excel 表格、写 Word 报告、操作浏览器、甚至制作视频。
但它和你平时用的 ChatGPT 有本质区别。区别在哪呢?我打一个比方你就明白了。
假设你家要装修。你找了两个人帮你:
第一个人是 ChatGPT。你拍一张厨房的照片给他看,他会告诉你这个灶台应该左移 20 公分,吊柜颜色建议换成奶油白。说得头头是道。
然后呢?没有然后了。你得自己去搬灶台、自己去刷漆。他只是给你出主意,但他不动手。
第二个人是 Codex。你说一句"把厨房重新装一下",他自己跑去量尺寸、自己画图纸、自己搬灶台、自己刷漆、刷完了还给你拍一张完工照让你验收。
而且更厉害的是,他能同时让好几个工人分头干活——一个人刷厨房,一个人装浴室,一个人修客厅灯,互不打扰,全都在后台进行。
放到实际工作里,就是这样:ChatGPT只能告诉你应该怎么做,但你得自己去操作。
而 Codex 能直接打开你电脑上的文件夹,自己创建文件、自己运行程序、自己上网搜资料、自己操作浏览器,改完了还能自己提交到代码仓库、自己部署上线。
这就是为什么大家管Codex 叫Agent——一个能自己动手干活的 AI,而不只是一个问答机器人。
02 怎么安装Codex
Codex 一共有四种使用方式:
Codex CLI、VS Code 插件版、桌面客户端和网页版
这四个版本性能都是一样的,功能也大部分重叠。
但如果综合使用难度、功能全面性和对新手的友好程度,那桌面客户端绝对是首选。
所以这条视频也主要以桌面客户端的使用方式进行讲解。
那下载和安装Codex之前,你需要先准备一个ChatGPT账号。
而且最好开通Plus会员或者Pro会员。
虽然现在免费账号也能使用Codex了,但我个人不太建议使用,因为额度非常少,用不了几次就没法用了。
Plus 用户每 5 小时能发 30 到 150 条消息给 Codex,正常使用一天是够的。如果你是重度用户或者公司用,可以考虑 Pro,额度高很多。
当然,如果你觉得会员费太贵,也可以去gaccode使用,具体使用教程看这个就行:fcai.me/codex 这里不做过多讨论,大家可以自行发掘。
Codex 相比同类工具,比如 Claude Code,有一个很大的优势:它给的额度更多,而且动不动就重置额度。
可能哪天只是因为天气好就给你重置额度,非常任性,根本用不完,同时对账号的限制也更少,比封号狂魔Claude强太多了。
那准备好账号之后,就可以装 Codex 了。
桌面客户端的安装非常简单,和安装其他普通应用没有任何区别。
打开浏览器,输入 Codex官网地址:chatgpt.com/codex,就可以看到Codex的下载入口了。
根据你的电脑系统下载对应版本的安装包,然后直接安装就可以了。
03 登录
安装好之后,打开 Codex,首先映入眼帘的是登录界面。这里有两种登录方式。
方式一:用 ChatGPT 账号登录
点界面上的 "Continue with ChatGPT"(用 ChatGPT 登录),浏览器会自动弹开,跳到 OpenAI 的登录页面。
输入你的 ChatGPT 账号密码
然后网页会问你"是否允许 Codex 访问你的账号?",点同意。浏览器会自动跳回 Codex App,登录完成。
用这种方式登录有三个好处:
第一,你的消息额度直接用 ChatGPT 订阅的配额,不用额外花钱。
第二,你能第一时间用到最强的 GPT模型。
第三,云端任务等高级功能全都解锁。
方式二:用 API Key 登录
如果你不想订阅 Plus,可以用 OpenAI 的 API Key 登录。
但这种方式有几个限制:API 的模型更新速度会比较慢,不一定能第一时间用上最新模型。
云端任务也不可用,而且是按用量付费——你让 Codex 跑一个大任务可能几十块钱人民币就烧掉了,加起来不一定比 Plus 便宜。
所以我的建议是,除非你有特殊原因,否则直接订阅 Plus 用 ChatGPT 账号登录是性价比最高的方案。
第一次使用的话,Codex会让你选择你日常使用Codex要完成的工作和场景,然后根据你的选择自动给你安装好一些常用的插件和技能。
你也可以选择跳过,之后手动设置和安装。当然你也可以使用第三方的api key,配置教程很简单,参阅这个:fcai.me/codex
04 认识Codex界面
登录成功后,你就进入了 Codex 的主界面。
左侧栏从上到下分成几个部分:
最上面是四个功能按钮。
第一个叫"新对话",点了之后就会在当前项目下创建一个新的对话窗口,用来给 Codex 布置新任务。
第二个叫"搜索",用来在你所有历史对话里搜关键词。比如你记得上周让 Codex 帮你改过某个文件,但忘了是哪次对话了,就可以用搜索找。
第三个叫"插件",点进去之后会看到两个页面:插件和 技能——这两个区别我们后面会详细讲。
第四个叫"自动化",是管理定时任务用的。这个我们也放在后面讲。
中间有两个列表,非常重要:一个叫"项目",一个叫"对话"。
这两个东西是不一样的。
"对话"相当于在桌面 App 里跟 ChatGPT 对话,和你在网页端跟 ChatGPT 聊天是一模一样的效果。
适合一些琐碎的工作,比如让它帮你搜集资料、写一段文案、翻译一段话、回答一个问题。
"项目"是一个更强大的东西。每个项目对应你电脑上的一个文件夹。
你在这个项目里做的所有事情——生成的文件、写的代码、做的 PPT、做的 Excel——全都会保存在这个文件夹里,不会丢失,方便管理。
简单来说:但凡涉及生成文件,比如PPT、Excel、Word、代码、图片……,就在"项目"里操作。只是随便聊聊、问个问题,用"对话"就行。
每个项目下面可以有很多个"对话"。一个对话处理一件事。你可以理解为:项目是一个大文件夹,对话是这个文件夹里的一个个工作线程。
最下面是设置按钮。 点进去能管理各种配置。
Codex主区域就是中间这一大块,是Codex 主要工作的地方。
最中心的区域是输入框,你可以直接用中文打字,告诉它你要做什么。
- 输入 @ 符号,会弹出一个列表让你选择插件(Plugin)或者指定某个文件作为上下文。
- 输入 $ 符号,可以触发某个技能(Skill)。
关于 @ 和 $ 的区别,后面讲"技能和插件"的时候会详细说。
输入框内部还有几个关键的小控件。
左下角有一个 "+" 号按钮。点开之后可以上传文件,比如 PPT、Excel、图片等等。
还有一个 Plan Mode(计划模式) 选项——开启后,Codex 只跟你讨论方案、不会实际改任何文件,等你确定方案之后再动工。
"+" 号旁边显示的是你当前的权限模式,因为 Codex 能直接改你电脑上的文件、能运行各种命令,所以有一个"放权等级"的概念——你选择什么模式就意味着你愿意给它多大的自由度?
这里总共有3种模式。
第一种,默认权限
这是最安全的模式。
Codex 只能在当前项目文件夹内部进行修改。凡是涉及联网、运行终端命令、访问文件夹外的东西,都必须问你同意才能继续。
适合新手和不确定 AI 会做什么的场景。
第二种,自动审查
这种模式下,对于那些"默认模式下需要问你的操作",Codex 会先自己评估一下风险。
如果它觉得这个操作很安全,比如创建一个新文件,就自动通过不问你了;
如果它觉得有风险,比如删除文件,才会弹框问你。
相当于给 AI 配了一个"内部审批员",减少你被频繁打断的次数,同时保留一定安全性。
最后一种,完全访问权限
这是Codex的最高权限。
Codex 可以做任何事情,不仅仅是当前文件夹内,它还可以去文件夹外面做操作,而且全程不需要问你同意。
优点是效率最高,AI 可以完全自主地一口气把复杂任务做完。
缺点是有一定风险——它可能删了你不想删的文件、装了你不想装的依赖、跑了你不想跑的命令。
对 Codex 行为已经很熟悉、项目有备份、追求最高效率的用户可以首选这种模式。
我的建议是新手第一周用 默认权限。第二周可以试试自动审查。等你非常熟悉之后、并且确保项目有 Git 备份的情况下,再考虑开完全访问权限。
输入框右下角显示的是当前使用的 AI 模型和思考强度。
点这个标签能就换模型和调思考强度。
所有可选的模型都会显示在这里。
GPT-5.5——目前最强的模型,推荐作为默认首选。它在复杂代码编写、重构、调试方面表现最好。
GPT-5.4——5.5 之前的主力模型,能力也非常强,覆盖绝大部分编程场景。
GPT-5.4 mini——一个更小更快的模型。适合简单任务,比如快速浏览代码、回答小问题、做一些不太需要深度思考的事情。好处是省额度、响应快。
GPT-5.3-Codex——专门为编程优化的老牌模型,在某些复杂工程任务上依然很强。
其余的模型就没有什么使用的必要了。
思考强度显示为"低"、"中"、"高"、"超高"四个档位。
这个参数决定了 AI 在回答你之前会"想多久、想多深"。
低——就是想都不怎么想就直接回答。速度最快,但容易犯低级错误。适合改个拼写、问个简单语法。
中——默认推荐档位。平衡了速度和质量,日常任务用这个就够了。
高——会花更多时间思考。适合有点复杂度的任务,比如跨文件的功能开发。
超高——想得最深、最慢、但最聪明。适合那种"普通模式下 AI 反复搞不定"的诡异 bug 或者大规模重构。
除了思考强度和模型之外,还有一个速度选项,有两个档位:
标准和快速
快速模式下,Codex工作的速度会更快,大概是标准模式的 1.5 倍,但相应消耗的额度也更多。
日常任务其实用标准模式就行。赶时间的时候可以切 快速模式。
在旁边是一个麦克风图标——你可以用语音输入需求,不想打字的时候特别方便。
最右边是发送按钮。
输入框下面还有一个按钮,是项目切换功能,点这里就能快速切换到其他项目。
旁边是这个项目的工作环境,总共有三种,本地、工作树和Codex web,这个我们一会儿再展开讲。
再下方是 Codex 给你推荐的几条建议任务。它会根据你的项目内容和历史对话,猜你可能想做什么。
你看到合适的可以直接点,它就当作你的输入了。
05 创建你的第一个项目
好,那现在界面搞清楚了,我们就来实际用一用。
第一步是创建一个项目。点左侧栏"项目"区域的添加按钮,会出现两个选项:
新建空白项目和使用现有文件夹。
新建空白项目会在默认路径下新建一个空文件夹。适合还没有代码、想从头开始的情况。
而使用现有文件夹是打开你电脑上已有的一个文件夹。
里面可以是空的,也可以有现成的代码、Excel 或其他文件。适合你想让 Codex 帮你处理已有项目的情况。
我们先选新建空白项目试试。点击后,左侧项目列表里会出现一个新项目。把鼠标浮在上面能看到它对应的文件夹路径。
你可以给它改名。
点项目名旁边的三个点,选"重命名",比如改成"Work"。改完后,输入框下面显示的项目名也会跟着变。
如果你想知道这个文件夹保存到了哪里? 点打开文件夹,就能在你电脑的文件管理器里看到这个文件夹。
以后 Codex 在这个项目里生成的所有文件——Word、PPT、Excel、代码全都在这个文件夹里面。
简单理解一下,就是每个项目等于一个文件夹。项目里的所有对话产生的文件,都集中在这个文件夹里,非常方便管理。
06 给 Codex 布置第一个任务
在输入框里打几句话告诉它你要做什么,然后点发送。
比如让 Codex 从零开始创建一个小项目:
“帮我创建一个简单的网站,有首页和"关于我们"两个页面,用 HTML + CSS 就行,不用太复杂,好看就行。”
或者如果你根本不写代码,只是想让它帮你干活,你可以直接给他发送:
“帮我写一份关于 AI 行业趋势的分析报告,保存成 Word 文档。”
发完消息之后,Codex 就会开始思考。你能在主区域看到它的思考过程——它在分析什么文件、打算做什么、为什么要这么做。
接下来它可能想修改某个文件或者运行某个命令。如果你的权限模式不是"完全访问权限",它会弹一个小窗口问你是否批准。 这个窗口通常有几个选项:
- 批准这一次:只批准这一次操作,下次类似的操作还会问你
- 本次对话全部批准:这次对话里后续同类操作不再问了
- 拒绝:不批准,让它想别的办法
如果你是新手,前几次用的时候,每次都看一眼它要做什么再批准。
不用着急,Codex 会等你。等你用了一两天、摸清了它的"行为模式"之后,再考虑放权。
Codex 改完文件之后,如果 Codex 帮你生成了网页、 Word 文档、PPT 或 Excel,你可以直接在这里点击文件名打开预览。
然后右侧面板就会展开,你就能直接看到详细的页面内容。
当然,我觉得最好用的是右上角的这个批注功能,如果你觉得页面的哪个细节不符合你的心意,你可以直接点击这里开启批注功能。
然后选中你不满意的地方,选中之后会出现一个输入框,直接把你的想法输入到这里,点击这个按钮添加上去。
然后在Codex主区域的对话框里就会出现这条批注,直接点击发送,Codex就会对你批注的细节进行精准修改。
修改完成之后,下方会显示这轮Codex修改的文件,点击右上角审核按钮,右侧就会出现一个差异面板。
它会把旧代码和新代码放在一起比较,用颜色标出来:绿色的是新加的、红色的是删掉的。
哪个文件改了、哪一行加了什么、删了什么,你都可以看得一清二楚。
你也可以点击某一行代码左侧的加号,可以像刚才一样写一条评论让Codex精准修改。
如果你觉得它修改的还不如刚才,那你可以点击撤销按钮,这样页面就会恢复成刚才的样子。
那如果你对改动满意,而且你的项目是用 Git 管理的,你可以直接在 Codex 里完成提交。
点击右上角的Git按钮,点击提交就可以了。如果想推送到 GitHub 远程仓库,再点"推送"(Push)。
不会 Git 也没关系,这些都是图形化按钮,跟保存文件差不多简单。
当Codex每次工作完之后,你可以在模型标签旁边看到一个小圆圈,这个小圆圈代表的是当前上下文窗口已经用了百分之多少。
也就是你现在使用的这个模型记忆容量已经使用多少了,GPT-5.5 的上下文窗口大约是 256k ,大概是几十万汉字。
不过这个不需要特别关注,因为 Codex 会自动帮你压缩上下文——对话太长了它会自动精简早期的内容,不用你手动处理。
07 多任务管理:排队、插队和并行
排队、插队和并行这三个是桌面 App 日常使用中非常高频的操作。
先说任务排队
假设 Codex 正在帮你做任务 A,比如生成一个网站。
这时候你突然想起来"做完之后帮我总结一下设计思路"。你不需要等它做完才说——直接在输入框里打字发出去就行。
你发出去的新消息会出现在输入框上方,排在任务 A 后面。Codex 会先做完 A,再自动开始做 B。这就是任务排队。
你可以排很多个任务,它会按顺序一个一个执行。
那什么是任务插队?
比如有时候你排了一个任务在队列里,突然又改主意了——你不想等到后面再执行,你想让当前正在跑的任务立刻考虑到你的新要求。
比如 Codex 正在帮你做网站,你排队了一个"总结设计思路"的任务。
但这时你突然想起来"我想要iOS风格的UI设计"。
如果你正常发这条消息,它会排在"总结设计思路"后面,等做完总结才轮到它——这样就太晚了,网站都做完了。
这时候你点消息旁边的引导/插队按钮。这条消息就会跳过排队,直接注入到当前正在执行的任务里。
正在做网站的 AI 会立刻把"iOS风格的UI设计"这个要求考虑进去,边做边调整。
那说完了排队和插队,最后说一说什么是多任务并行。
排队和插队都是在同一个对话里发生的。但如果你想让多个任务同时进行、互不影响怎么办呢?
很简单:开一个新对话就行。
在左侧栏你当前项目名字旁边点击创建新对话,开一个新的对话窗口,在里面布置另一个任务。
这个新任务会和之前的任务同时跑、互不干扰。
你可以在左侧栏看到:两个对话条目旁边各有一个滚动图标,表示它们都在同时执行。
你甚至可以跨项目并行——去另一个项目里也布置一个任务,不同项目之间的任务同样可以并行。
需要注意的一点:不同对话之间,聊天记忆(上下文)是不共享的。
也就是说对话 A 里聊了什么,对话 B 不知道。但它们都可以看到当前项目文件夹里的所有文件——因为文件夹是同一个。
08 插件(Plugins)和技能(Skills)
点左上角的"插件"按钮,进去之后你会看到两个页面:插件和技能。
这两个概念很多人搞混,但区别其实很简单。
技能,也就是大家常说的Skills,就是一套写好的执行步骤。
我们为了完成某个特定任务,往往有一套固定的流程。
比如"生成一张图片"的流程是:确定画面描述 → 选择风格 → 调用生图模型 → 输出图片。
把这整套流程、注意事项、资源打包写成一个 Markdown 文件,就是一个 Skill。
Codex 需要做这个任务的时候,就会读取这个 Skill 文件,按照里面的步骤一步一步执行。
你可以理解为:技能 = 一份"说明书"。
Codex 里最常用的内置技能是 Image Gen(图片生成)——它可以让你在对话里直接让 AI 生成图片,用的是 GPT Image 2模型。
那插件又比技能"大"一个级别。一个插件里面往往包含了多个技能,再加上与外部应用的连接能力。
举个例子:Codex内置的Computer use插件,可以直接接管你的电脑。
这个插件里面可能就包含了好几个技能——比如"操作APP"是一个技能、"屏幕录制"是一个技能、"键盘操作"是一个技能。
也就是说,插件 = 多个技能 + 与外部应用的连接,打包在一起一键安装。装一个插件,就有了让 AI 操作这个外部应用的全部能力。
Codex 内置了非常多插件,你可以在"插件"页面浏览和搜索。这里列几个常用的:
日常办公类:
- Document——生成和编辑 Word 文档
- Spreadsheets——操作 Excel 表格
- Presentation——生成和操作 PPT
外部应用连接类:
- Gmail——读写谷歌邮箱
- GitHub——管理代码仓库、建 issue、做代码审查
- Slack——发消息、读频道
- Linear / Jira——项目管理和任务追踪
能力增强类:
- Browser Use——让 Codex 操作浏览器(访问网站、截图、录屏、抓取信息)
- Vercel——一键部署网站到云端
- Hyper3D——制作视频
安装任何一个插件,你的 AI 智能体就有了操作这个软件或者服务的能力。
那怎么在对话里触发这些插件或者技能呢?
正常情况下,Codex会根据你的任务来自主判断要不要调用某个插件或者技能。
但如果你就想要指定调用某个插件,在输入框里打 @,会弹出插件列表,选你要用的就可以手动触发。
比如:
“帮我分析今天某只股票的情况,使用 @Document 总结成一份报告”
Codex就会直接调用这个插件。
手动调用技能也是同样的方法,只不过把 @换成了$ 比如:
“帮我生成一张赛博朋克风格的 banner 图,使用 $image gen”
你也可以在一条消息里同时使用插件和技能,比如:
“帮我分析今天某只股票的情况,
使用 @Document 总结成 Word 报告,
并且使用 $imagegen 生成一张封面图放在报告开头”。
09 用 Codex 完成日常办公
正如一开始所说的,Codex现在已经不是一款简单的AI编程工具了,而是一个能帮你干各种工作的全能助手。
尤其是借助强大的插件生态,我们可以借助Codex帮我们完成很多日常工作。
比如生成word文档
首先确保你安装了Document 插件。然后发送下面这段指令:
“帮我写一份关于 AI 行业 2026 年趋势的分析报告,
使用 @Document 保存成 Word 文档。
要求:有目录、有表格对比各大模型、有结论。”
Codex 会自动联网搜集资料、整理分析、生成一份格式好看的 Word 文档。
生成完之后你可以直接在 App 里点击文件名打开预览,看到效果满意就行,不满意可以在预览界面下方的输入框里继续让它改。
再比如生成 Excel 表格。
这次用到的是Spreadsheets 插件,如果没有安装的话现在插件页面进行安装。发送下面这段指令:
“帮我做一份 AI 相关股票的对比表格,
使用 @Spreadsheets 保存成 Excel 文件。
包括股票名、今日涨跌幅、市值、一句话总结。
用不同颜色标注涨和跌。”
然后你就会得到一份详细完整的Excel文件。
最后是生成 PPT。
生成PPT需要用到的是 Presentation 插件。同样的方法,在提示词里@出这个插件:
帮我做一份 10 页的 PPT,主题是"AI 改变工作方式",
使用 @Presentation 生成。
风格要简洁商务,每页有要点和配图说明。
就可以让Codex直接生成PPT了。
你甚至可以在一条消息里同时要求生成 Word、Excel 和 PPT,比如:
“帮我搜集今天 AI 行业的最新动态,然后:
1.使用 @Document 写一份详细的分析报告
2.使用 @Spreadsheets 做一份数据汇总表
3.使用 @Presentation 做一份简报 PPT
4.使用 $imagegen 生成一张封面图
三个文件都保存在当前项目文件夹里。”
你就可以同时得到这四份文件,非常方便。
10 自动化:让 Codex 每天定时帮你干活
刚才那些日常办公的例子,如果你每天都要做,比如每天出一份股票分析报告,那你不能每天都手动输入同样的要求。
这时候就需要用到Codex的自动化。
最简单的方式:直接在对话里用自然语言告诉它。 比如:
“帮我设置一个自动化任务:
每天早上 9 点,自动搜索今天 AI 相关股票的信息,
然后用 @Document 写一份分析报告,
用 @Spreadsheets 做一份数据表,
用 @Presentation 做一份 PPT。
所有文件保存在当前项目文件夹里。”
Codex 会自动帮你创建一个定时自动化任务。
创建完之后,点击左上角的"自动化"按钮,就能看到你所有的自动化任务列表。
点击对应的任务就可以进入这个任务的详情页,左边是这个自动化的详细描述。
右边是各种参数,比如状态、下一次运行时间、运行环境和在哪个项目文件夹里运行。
你可以点立即运行,手动跑一次看看效果,也可以手动修改任务描述、时间表、模型等等参数。
你也可以在右上角这里选择暂停或删除这个自动化任务。
那这里如果你是第一次使用Codex的自动化功能的话,不要一上来就创建自动化。
先在一个普通对话里把你的指令试一遍,确认 Codex 理解了你的意思、跑出来的结果是你想要的。
确认没问题了,再把这个指令变成定时任务。
不然你可能设了一个每小时跑一次的自动化,但指令写得不清楚,跑出来的全是没用的东西,白白浪费额度。
11 三种对话模式:本地、工作树、云端
这是桌面 App 一个重要的功能。当你新建对话时,可以通过输入框左下方按钮选择 Codex 在哪种"环境"里干活。
总共有三种环境:本地、工作树、云端
首先是本地模式。
这是最简单直接的模式。Codex 就在你电脑上、你项目文件夹里直接改文件。 它改了什么你马上就能在文件夹里看到。
这种模式下适合简单的小修改,比如改个样式、修个小bug、加几行代码。你想立刻看到效果的时候用这个。
不过在这种模式下,因为它直接改的是你真正的文件,如果改坏了,你需要手动撤回。所以用本地模式之前,最好先养成及时备份的习惯。
而工作树模式,则是Codex的一个核心功能。
假设你在用本地模式,让 Codex A修改某个文件。
与此同时你又开了一个对话让 Codex B也修改这个文件。
两个 AI 同时改同一个文件,必然会冲突。
就像两个人同时在一张纸上写字,谁都不知道对方在哪写了什么,最后这张纸就乱了。
工作树模式解决的就是这个问题。
当你选择工作树模式时,Codex 会在后台给你的项目创建一个"平行副本"——一模一样的代码,但在一个独立的文件夹里。
Codex 在这个副本上干活,完全不动你原来的项目文件。
打个比方:你在写一份合同,需要让两个律师分别修改不同条款。
你把合同复印了两份,给律师 A 一份、给律师 B 一份。
他们各改各的,改完了你再对比两份修改意见,挑好的合并回原始合同。
工作树就是这个"复印"的过程。
那具体怎么使用工作树呢?
首先,新建对话的时候,在这里选"工作树"模式。
它会让你选"基于哪个分支创建"——一般选你的主分支就行。不知道什么是分支也没关系,选默认的就好。
Codex 会自动创建一个工作树,然后在里面干活。你原来的项目文件一点都不会变。
当Codex工作完之后,差异面板里会清楚地显示工作树里改了什么。
你审完之后,就可以选择合并到本地、创建新分支、或者直接扔掉。
最后是云端模式。
这个模式主要是把任务发到 OpenAI 的服务器上执行。
你的电脑不用一直开着,任务在云端自己跑,跑完了结果存在那里等你来看。
适合特别耗时的大任务,但是要使用云端模式需要先关联Codex web。
并且连接 GitHub 仓库,配置稍微复杂一点,而且大多数情况下也用不到这种模式。
所以新手可以先不管,用本地和工作树就够了。
12 操作浏览器和操作电脑
操作浏览器和操作电脑是 Codex 目前相比其他同类工具非常突出的能力。
安装 Browser Use 插件之后。
Codex 就有了操作浏览器的能力——它可以自己打开浏览器、访问任何网站、点击按钮、填写表单、截图、录屏、抓取页面上的信息。
比如,我想让Codex帮我在Canvas里找几个适合职场汇报的免费模板,然后修改标题并截图,最终给我输出一份报告,
在输入框输入@,然后选中浏览器插件,直接把这段内容发给它:
打开https://www.canva.com/templates/,帮我找一个适合“职场AI效率”的封面模板。
它会自己连接浏览器、一个页面一个页面地去看、自己截图和录屏,然后把结果整理给我。
只有遇到需要登录账号的时候需要我来操作,其余全程都不需要动手。
Codex 不仅能操作浏览器,还可以在一定程度上操作你电脑上的其他应用。不过目前只支持mac系统,Windows电脑还无法使用。
比如我想让Codex直接打开我电脑的Chrome浏览器,在小红书上给我下载一篇笔记,先在输入框输入@选中电脑插件,然后输入指令:
“打开我电脑上的Chrome浏览器,打开小红书,搜索关键词Codex,把最新的一条图文笔记下载下来,并在桌面新建一个小红书文件夹保存 ”
然后就可以看到Codex操控电脑的整个过程,全程由 AI 自主操作,你完全不需要插手。
最终它会按照我们的要求把这篇小红书笔记完整下载下来,而且还没有水印,质量非常高。
13 AGENTS.md:给你的Codex写一份说明书
在你项目的根目录下创建一个文件叫 AGENTS.md。
Codex 每次启动的时候就会自动读这个文件,把里面写的规则当作"工作守则"来遵守。
那为什么要写这个文件,主要是因为我们在一个项目里每次开新对话的时候,Codex是没有其他窗口的记忆的。
很多注意事项我们可能在一个对话窗口里说过之后,在其他对话窗口还要再重复一遍,一两次还行。
但如果你要做的项目比较复杂,需要创建很多个窗口并行处理任务,那就会非常麻烦。
所以AGENTS.md就是解决这个问题的。你把这些规则写一次到文件里,它就再也不会忘了。
就像给新来的同事写一份入职手册,我们部门的规矩是这样的,第一条是什么,第二条是什么,全都给他一次性写清楚,他以后做事就会按照手册来。
那怎么写这份文件呢?
在你项目文件夹最外面那层,新建一个文件叫 AGENTS.md。
然后用任何文本编辑器打开它,用中文写清楚规则就行。
这里给你一个可以直接套用的模板:
# AGENTS.md
你直接复制保存就可以。
下次 Codex 在这个项目里干活时,它会自动读取这个文件并遵守里面的规则。
另外,还有一个小技巧,AGENTS.md 最好控制在 150 行以内。
写太长的话,AI 的记忆容量会被这个文件占掉一大块,反而影响它理解你的具体需求。
14 内置终端
按 Cmd+J(Mac)或 Ctrl+J(Windows),App 底部会弹出一个终端窗口。
你也可以点右上角的终端图标来打开。
这里给不太了解终端的同学简单解释一下:
终端就是一个你可以输入命令的窗口。程序员经常要在终端里输入命令来运行程序、安装工具、查看文件。
Codex App 把终端内置了,你不用再另外打开一个窗口。
这个终端有两个特别的地方:
第一个是它的工作目录会自动跟着你当前的对话走。 如果你当前对话是在工作树里,终端就自动切到工作树的目录。
你不用自己手动切换来切换去。
第二个是Codex 能读取终端里的输出。
比如你在终端里启动了一个开发服务器,Codex 能看到终端里的日志,自动判断服务器有没有跑起来、有没有报错。
这里再分享一个非常实用的技巧。
如果你同时安装了 Claude Code(Anthropic 出的另一款 AI 编程工具),你可以在 Codex 的内置终端里直接输入 claude 来启动 Claude Code。
这样你就能同时使用两个AI:用Codex 做它擅长的事,比如操作浏览器、生成图片、管理任务。
用Claude Code 做它擅长的工作。
比如你用 Codex 做了一个网站的所有功能和后端逻辑,但觉得前端设计不够好看。
你可以在终端里启动 Claude Code,专门让它优化前端的页面和视觉效果。因为Claude 系列模型在前端设计审美方面确实要更好。
15 实战:从建站到上线的完整流程
那现在我们学会了Codex的各种核心功能,接下来我们就用Codex来完成一个完整的工作流:用 Codex 做一个个人网站,然后部署上线,让全世界都能访问。
首先,我们新建一个项目,命名为个人品牌网站,在项目对话里输入:
“帮我做一个个人品牌网站,极简风格,参考 Apple 或 Linear 的设计。
打开就能知道我是谁、做什么、在哪里关注我。
我的信息:
-
名字:XXX
-
职业:XXX
-
社交媒体链接:xxx、yyy、zzz
-
我的产品:aaa、bbb
做完之后在本地运行起来让我看看效果。”
Codex 会帮你从头写代码、自动在本地跑起来一个开发服务器,然后给你一个本地网址(比如 http://localhost:3000)让你在浏览器里预览。
如果觉得哪里不满意,直接在对话里告诉它:
比如(这里根据实时做出来的效果来给它下修改命令,比如调整颜色、排版等等之类的)
然后它就会实时修改,你刷新浏览器就能看到新效果。
最后一步,就是部署上线
调整满意之后,现在网站还只是在你本地电脑上跑的。
你关了电脑别人就看不到了。要让全世界都能通过一个网址访问,那就需要部署。
部署就是把你电脑上的网站代码交给一个"云平台",让它帮你运行,然后给你一个公开的网址。
无论任何人、任何时候访问这个网址,都能看到你的网站。常用的云平台有 Vercel、阿里云、腾讯云等等。
你需要先安装 Vercel 插件,在插件页面搜索 Vercel 安装,安装时会让你登录 Vercel 账号进行授权。
然后回到对话里说:
直接@ 选择VerVercel插件,让它把这个网站部署上线。
不一会儿,Codex 就会完成部署,给你一个公开的网址。现在全世界任何人都可以通过这个网址访问你的个人网站了。
是不是非常简单?
16 Codex使用小技巧
1、涉及文件就用项目,不要用对话
"对话"适合随便问问,"项目"适合干实事。
但凡你需要 Codex 生成任何文件——哪怕只是一个简单的文本文件——都在项目里做。
这样生成的文件有统一的管理位置,不会乱。
2、一个任务一个对话
不要在一个对话里塞十件不同的事情。
"重构登录" 是一个对话,"加用户头像" 是另一个。每个对话越"纯",AI 的表现就越好。
3、复杂任务先让 Codex 出计划
不要上来就让它动手。点 "+" 号里的 Plan Mode(计划模式)。
或者直接在对话里说"先给我一个执行计划,不要动手"。
它会列出它打算做什么、改哪些文件、分几步做。你看了没问题再让它实施计划。
4、写清楚"什么叫做完了"
不要说"帮我修这个 bug",要说"帮我修这个 bug,做完的标准是:
测试全过、手动测一遍能用、没改无关文件"。
有了完成标准,Codex 会自己去验证,而不是改完就交差。
5、经常 commit(提交)
每完成一个小步骤就 commit (提交)一下。
桌面 App 里有图形化的 commit 按钮,点两下就完事。
勤 commit 的好处是:万一 Codex 改坏了,你能迅速回到上一个正确的状态。
6、让 Codex 审查 Codex 的代码
没错,你可以让 AI 审查 AI 写的代码。完成一个大任务之后,新开一个对话。
告诉 Codex"帮我审查一下上一次改动的代码。
重点检查安全性和性能"。它经常能挑出自己第一次没注意到的问题。
17 常见问题和解决方法
1、用着用着提示"已达使用上限"
ChatGPT的额度是每 5 小时滚动刷新的。
意思是你 5 小时前发的消息会"过期",腾出新额度。
所以不用慌,等一两个小时就有额度了。如果经常不够用,可以升级 Pro 版本。
2、Codex 把代码改坏了
如果用的是工作树模式:恭喜你,什么都不用操心。工作树是独立副本,直接扔掉就行。
如果用的是本地模式:在差异面板里点"全部撤销",或者在终端里输入 git checkout .。
这也是为什么我一直在强调,让Codex修改东西之前一定要先点击提交。这样即使改成什么样我们都能退回来。
3、完全访问权限下 Codex 搞了一些你不想要的操作
如果你的权限模式是"完全访问权限",Codex 干什么都不会问你。
它可能删了你不想删的文件、装了你不想装的依赖、跑了你不想跑的命令。
那如果你是新手的话,不要一上来就开"完全访问权限"。保持默认的权限模式。
等你非常熟悉 Codex 的行为之后、并且确保项目有 Git 备份的情况下,再考虑放权。
4、Codex 改了一堆你不想改的无关代码
这是很常见的问题。你让它"修一个 CSS 样式",结果它顺手把相关组件的结构重构了、把变量名重命名了、甚至引入了一个新的库。
解决办法也很简单, 在你的 AGENTS.md 里明确写"没有我的要求不要做额外优化,只做我布置的任务"。
在具体任务里也说清楚"只改 XXX 文件,不要碰其他文件"。
18 写在最后
Codex 已经从一个纯"编程工具"进化成了一个"用 AI 来完成各种工作"的全能助手。
所以,我非常建议大家不管是不是程序员,都要尽早学会使用Codex,结合到自己的实际业务中进行提效。
比如你是运营,那你可以设一个自动化任务,每天 8 点让 Codex 自动帮你搜资料、做 Word、做 Excel、做 PPT。
再比如你是设计师,想快速出一个交互原型,那就告诉它你的思路,让它按照你的构思做一个页面,快速验证你的想法。
又或者你是自媒体博主,那你可以让它按照你给的关键词去搜索整理分析相关的爆款选题等等。
你不需要懂 HTML、CSS、JavaScript 这些东西。
你只需要用中文说清楚你要什么,Codex 帮你生成文件、帮你运行、帮你出结果。
当然,Codex能发挥出多大的威力,核心还要取决于你,你越懂自己的项目、越能清晰地描述你的需求,它就越能高质量完成任务。
如果你一句话都不说就扔一个含糊的需求过去,他也能给你搞出点东西——但大概率不是你想要的。
最后,祝你和 Codex 合作愉快。