Codex 基本使用

0 阅读11分钟

✨ 这篇写给第一次接触 Codex 的小红书用户。

你不一定要会写代码,但你要会把需求说清楚。

剩下的,让 Codex 帮你看文件、拆步骤、改内容、跑检查。

🧭 阅读地图

章节你会学到什么
01 安装ChatGPT 和 Codex App 怎么下载、第一次打开要注意什么
02 提需求怎么把一句模糊想法,说成 Codex 能执行的任务
03 计划模式大需求怎么先出方案,避免一上来乱改
04 插件插件能帮 Codex 多做哪些事
05 Git 管理diff、commit、push、PR 分别是什么
06 设置个性化、MCP、钩子、Git、浏览器、电脑操控怎么选
07 vibe coding 展示看一组完整操作截图,理解实际使用过程

新手先记住一句话:先让 Codex 看清楚项目,再让它动手。


01|下载安装

✅ 1. 先下载 ChatGPT

下载入口:ChatGPT 下载页

📌 图注:先安装 ChatGPT 桌面端,用同一个账号登录。

✅ 2. 下载 Codex App

下载入口:Codex App 下载页

📌 图注:Codex 入口和 ChatGPT 下载入口在一起,按系统选择安装。

✅ 3. 第一次打开要做什么?

第一次打开后,按提示登录账号,然后选择一个工作文件夹。

这里别随便选整个电脑。建议你专门建一个文件夹,比如:Codex练习项目

以后你让 Codex 改网页、写文档、整理文件,都先放在这个文件夹里。

⚠️ 小提醒:第一次练习,文件夹越干净越好。别一上来就把整个桌面交给它。


02|怎么提需求

很多人第一次用 Codex,会直接说:帮我做个网站

这不是不行,但它很难判断你要什么风格、什么内容、做到什么程度。

更好的提法是:

💡 万能结构:背景 + 目标 + 约束 + 交付物

🧩 1. 新手万能公式

我想做/修改【什么东西】。

目标是【给谁用、解决什么问题】。

请你先看一下当前文件,然后按现有风格实现。

要求:【列 3-5 条具体要求】。

完成后告诉我你改了哪些文件,以及我怎么检查。

🖥️ 2. 改网页示例

我想把这个个人主页改得更适合小红书博主。

目标用户是想了解我服务的人。

请先阅读项目结构,不要大改技术栈。

要求:

  1. 首页第一屏要清楚展示我是谁、能提供什么服务

  2. 增加一个作品展示区

  3. 移动端也要好看

  4. 文案不要太 AI,要像真实博主自己写的

完成后告诉我改了哪些文件,并启动本地预览让我检查。

📝 3. 写文档示例

请根据这个文件夹里的资料,整理一篇适合飞书发布的教程文档。

读者是零基础小红书用户。

语言要通俗,不要太像官方说明书。

结构要清楚,每一节给一个配图建议。

最后给 5 条新手避坑提醒。

🛠️ 4. 修 bug 示例

这个页面在手机上按钮会超出屏幕。

请你先复现问题,再定位原因。

只修这个布局问题,不要重构其他功能。

修完后请用浏览器截图或说明验证方式。

如果你不确定怎么说,就先让 Codex 帮你把需求整理成任务:

我想做一个大概这样的功能:……

请先帮我拆成清晰的需求清单,不要直接改文件。

📌 图注:需求说得越具体,Codex 越不容易跑偏。


03|计划模式

计划模式可以理解成:先让 Codex 写施工方案,再决定要不要动手。

当你的需求比较大,或者会影响很多文件时,建议先用计划模式。

✅ 什么时候要先做计划?

适合先做计划的情况:

  • 从 0 做一个网站、工具或小游戏。
  • 要改一套页面风格。
  • 要重构项目结构。
  • 要接入登录、支付、数据库、第三方平台。
  • 你自己也不确定该怎么拆任务。

不太需要计划的情况:

  • 改一个按钮文案。
  • 修一个很明确的小 bug。
  • 整理一个小文件。

👀 计划模式里该看什么?

看 4 件事就够了:

  1. 它有没有理解你的目标。
  2. 它会不会动太多不相关的东西。
  3. 它有没有说清楚要改哪些模块。
  4. 它有没有安排检查方式。

如果计划看起来太大,可以直接说:

这个计划太大了。请缩小范围,只做第一版最小可用功能,先不要做高级功能。

如果计划太空,可以说:

请把计划写得更具体一点:包含要改哪些文件、每一步怎么验收、哪些地方先不做。

📌 图注:大需求先让它出计划,别一上来就让它乱改。


04|插件

插件可以理解成:给 Codex 加工具。

没有插件时,它主要是在项目文件里读、写、跑命令。

装了插件后,它可以做更多事,比如:

  • 用浏览器打开网页、截图、点按钮。
  • 连接 GitHub,看 PR、修 CI、提交代码。
  • 处理 Word、表格、PPT。
  • 连接 Figma,把设计稿转成页面。
  • 连接 Slack、Linear、Google Drive 这类工作工具。

⚠️ 图注:插件不是越多越好。用到哪个装哪个,不认识的先别乱开。


05|Git 管理

Git 可以理解成:项目的版本记录本。

Codex 改完东西后,你需要知道它改了什么、要不要保存成一个版本、要不要发到远程仓库。

🟢 1. diff 是什么?

diff 就是“改动对比”。

红色通常表示删掉的内容,绿色通常表示新增的内容。

每次 Codex 改完,先看 diff。 不要它一说“完成了”,你就直接提交。

📸 2. commit 是什么?

commit 就是把当前改动存成一个版本。

像给项目拍一张照片:

这次改了首页布局

这次修了登录按钮

这次整理了教程文档

好的 commit 信息应该让未来的你看得懂。

比如:

docs: add Codex beginner guide for Xiaohongshu users

☁️ 3. push 是什么?

push 就是把本地版本推到远程仓库,比如 GitHub。

如果你只是本地练习,不一定需要 push。

如果你跟团队协作,或者要备份到 GitHub,就会用到 push。

🔍 4. PR 是什么?

PR 全名 Pull Request,可以理解成“我改好了,请来审核一下”。

团队项目里,一般不是直接把代码合进去,而是先开 PR,让别人检查。

Codex 也可以帮你写 PR 描述、总结改动、根据别人评论继续修。

⭐ 5. 新手最重要的一句

先看 diff,再 commit;不确定就让 Codex 解释改动。

你可以这样问:

请用中文总结这次改动,按文件列出来。哪些地方是主要改动?有没有风险?

📌 图注:绿色是新增,红色是删除,提交前一定要扫一眼。


06|设置

⚙️ 设置不是越复杂越厉害。

先按默认用,遇到具体需求再调整。

📌 图注:设置页不用一次看完,先重点看个性化、Git、浏览器、电脑操控

🎭 1. 个性化

个性化主要决定 Codex 跟你说话的风格,以及它默认要遵守哪些个人习惯。

常见风格有:

风格适合谁
Friendly想让它多解释一点的新手
Pragmatic已经知道自己要什么,想要回答更直接的人
None想要更中性回答的人

新手建议先选 Friendly。 如果你觉得它话太多,再切到 Pragmatic。

自定义说明可以这样写:

请默认用中文回答。

解释要通俗,不要堆术语。

修改文件前先说明计划。

涉及删除、覆盖、联网、推送 Git 时,必须先确认。

⚠️ 注意:自定义说明可能会写入个人的 AGENTS.md 或相关个人配置里。 它的作用有点像“长期偏好”,不是每次聊天都要重新说。

🔌 2. MCP 服务器

MCP 就是给 Codex 接外部工具和资料库的接口。

比如:

  • OpenAI Docs MCP:让 Codex 查官方 OpenAI 文档。
  • Figma MCP:让 Codex 读取设计稿信息。
  • Playwright MCP:让 Codex 操作和检查网页。
  • Sentry MCP:让 Codex 看错误日志。

什么时候用?

当你发现 Codex 需要“看项目外面的东西”时,就可能用到 MCP。

比如你说:

请参考最新 OpenAI 官方文档,帮我改这个 API 调用。

或者:

请根据 Figma 设计稿还原这个页面。

新手建议:

  • 先用官方推荐的 MCP。
  • 不要随便添加来路不明的 MCP。
  • 如果 MCP 要登录授权,看清楚它能访问什么。

如果你只是写文案、改本地小项目,暂时不配 MCP 也没关系。

🖼️ 图位:这里可以补一张 MCP 设置或服务器列表截图。

📌 图注:MCP 像“外接工具箱”,用到再加,不认识的别乱开。

🪝 3. 钩子

Codex 做某些动作前后,自动跑一下你提前设置好的检查。

比如:

  • 它准备执行命令前,先检查命令是否安全。
  • 它改完代码后,自动跑格式化或测试。
  • 它提交前,自动检查有没有敏感信息。

这个功能更适合团队或高级用户。

普通新手不用一开始就配。你只要知道:钩子是用来给 Codex 加“自动规则”的。

等你以后有固定流程了,比如每次改完都必须跑测试,再考虑配置。

🌿 4. Git

Git 设置主要影响 Codex 怎么处理分支、提交信息和 PR 描述。

这里最常见的设置有:

  • 分支命名规则:让 Codex 新建分支时名字更统一。
  • 是否允许 force push:是否允许它强制推送覆盖远程记录。
  • commit message 生成规则:让提交信息更像你或团队的习惯。
  • PR 描述生成规则:让 PR 内容更清楚。

新手重点看一个:force push。

如果你不知道它是什么,先不要随便开。

force push 可以理解成“强行覆盖远程记录”。用得对很方便,用错了可能把别人或自己的提交弄乱。

你可以在 Git 设置里写类似规则:

提交信息请用简洁英文,格式为 type: summary。

PR 描述请用中文,包含改动内容、验证方式、风险。

不要主动使用 force push,除非我明确要求。

🖼️ 可补充:这里适合放一张 Pull Request 指令或 Git 设置截图。

🌐 5. 浏览器

Codex 里的浏览器分两种理解:

类型适合场景
内置浏览器打开本地预览、公开网页、文件页面
浏览器插件 / Chrome 扩展处理需要登录态的网站

第一种是内置浏览器

它适合打开本地预览页面、公开网页、文件页面。比如你做了一个网页,Codex 可以打开 localhost 看效果、截图、点按钮、检查布局。

第二种是浏览器插件或 Chrome 扩展

它更适合需要登录态的网站,比如你已经在 Chrome 登录了某个平台,Codex 需要在这个真实页面里帮你查看或操作。

浏览器设置里通常可以管理:

  • 是否启用 Browser 插件。
  • 哪些网站允许 Codex 使用。
  • 哪些网站禁止 Codex 使用。
  • 是否安装 Chrome 扩展。

新手常用场景:

请启动本地预览,用浏览器打开首页,检查手机端布局有没有溢出。

或者:

请用浏览器打开这个页面,截图并告诉我哪里需要优化。

🖱️ 6. 电脑操控

Codex 坐在你电脑前,按你的要求操作鼠标键盘。

它通常需要系统权限,比如:

  • 屏幕录制权限:让 Codex 看见屏幕。
  • 辅助功能权限:让 Codex 点击、输入、切换窗口。

适合什么场景?

  • 测试一个桌面软件流程。
  • 操作需要登录的网页。
  • 检查 UI 是否真的显示正常。
  • 帮你完成一些重复点击、复制、整理动作。

不适合什么?

  • 支付。
  • 转账。
  • 删除重要资料。
  • 操作隐私页面。
  • 处理你不希望 AI 看到的内容。

新手使用建议:

第一次用电脑操控时,人一定要在旁边看着。

你可以这样说:

请打开这个 App 检查设置页面,但不要点击任何删除、支付、提交、发送按钮。每一步操作前先告诉我你准备做什么。

如果你发现它要点危险按钮,立刻暂停。

⚠️ 注:电脑操控很强,但越强越要盯着用。


07|vibe coding 展示

这一节可以当作实际操作展示区。图片不用解释太多,读者扫一遍就能知道 Codex 是怎么一步步跑起来的。


🌟 最后给新手的 5 句话

  1. 先让 Codex 看项目,再让它动手。
  2. 大任务先出计划,小任务再直接改。
  3. 权限弹窗别闭眼点,先看它要干嘛。
  4. 改完一定看 diff、看预览、看结果。
  5. 你越会描述目标,Codex 越像一个靠谱搭子。

📚 参考资料