codex30分钟掌握Codex的97%功能(完整教程)

30分钟掌握Codex的97%功能(完整教程)

微信:taiyang54541

Codex 是 OpenAI 推出的 AI 编程助手——不是2021年那个已经停用的代码补全 API,而是全新的版本。它在2025年4月以命令行工具(CLI)的形式首次发布,随后发展出桌面应用、VS Code/Cursor/Windsurf 的 IDE 插件,以及云端版本。

Sam Altman 在2026年4月透露,Codex 已经拥有约400万周活跃用户。它现在是 Claude Code 最直接的竞争对手。

如果你用过 Claude Code,可以用一句话理解 Codex:本地的一个文件夹 + 一个 markdown 配置文件 + 一个能读取所有文件的 AI 智能体 + Skills(技能)、MCP 服务器、自动化任务和内置浏览器

不同的工具外壳,不同的模型,但核心理念相同。

14个步骤。3个层次。一个文件夹搞定所有工作流。

第一部分 · 基础设置

01. 在电脑上创建项目文件夹

Codex 没有自己的数据库、文件系统或“工作区”。一个 Codex 项目,就是你电脑上的一个普通文件夹。当你新建项目时,Codex 会让你选择一个文件夹。

选好文件夹后,里面的所有文件都可以被 Codex 自由操作:读取、写入、编辑、整理、移动。

这个简单的设计带来了巨大的灵活性:

  • 项目完全可移植。 同一个文件夹可以在 Codex CLI、Codex 桌面应用、VS Code/Cursor/Windsurf 的 IDE 插件中打开——甚至可以用 Claude Code 或 Cursor 打开。工具换了,项目内容不变。

  • 可以像管理代码一样做版本控制。 Git、GitHub、Vercel——都是标准工具,不需要特殊集成。

  • 备份、分享、迁移都很简单,就像操作普通文件夹一样。

\

Codex 默认以智能体模式运行——它可以自动读取、编辑和运行工作目录内的命令。文件夹外的内容以及网络访问仍需要你的批准。文件夹就是信任边界。

02. 编写AGENTS.md** 配置文件** :Codex 启动时首先读取的文档

这是 Codex 中最被低估的文件。AGENTS.md 放在项目根目录,每次你在该文件夹中打开新对话时,Codex 都会读取它。

它会告诉 AI 智能体:你是谁、项目是什么、目标是什么、有哪些限制条件。

小技巧:不要从头写。 用简单的话告诉 Codex 你的项目目标,让它帮你起草一个 AGENTS.md。你会得到一个结构完整的文件,然后再根据需要修改。这样更快、更完整、不容易遗漏。

plaintext

# 项目YouTube评论智能分析

## 背景
我运营一个关于AI工具的YouTube频道我想了解
观众在问什么他们想看什么他们在比较什么工具——
而不用手动阅读每条评论

## 目标
构建一个工作流提取最近的评论对其分类
发现模式并在实时仪表板上可视化结果

## 约束条件
- 使用YouTube Data API v3和API密钥不用OAuth)。
- 将凭证保存在.env.local中永远不要提交到代码仓库
- 输出目标用于分析的Excel工作簿 + Web仪表板
- 将仪表板部署到Vercel
- 通过自动化每周刷新数据

## 工作习惯
- 将失败的方法保存到项目记忆中避免重复犯错
- 在编写代码之前始终确认计划

一个好的 AGENTS.md 应该包含:

  • 背景——一段话。 你是谁、为什么做这个项目。这样就不用每次对话都重新解释。

  • 目标——一段话。 描述最终状态,而不是具体步骤。步骤属于计划模式(步骤3)。

  • 约束条件——列表形式。 硬性规则。比如 API 选择、要避免的语言、安全边界、输出格式。越简短具体越好。

  • 工作习惯——列表形式。 比如“将经验教训保存到记忆中”、“始终先确认计划”、“永远不要运行 X”。这些会累积成可靠的工作模式。

OpenAI 官方的最佳实践指南明确指出:“当你把 Codex 当作一个可以配置和持续改进的队友,而不是一次性助手时,Codex 效果最好。从正确的任务背景开始,使用 AGENTS.md 进行持久指导,配置 Codex 以匹配你的工作流。”

03. 每次构建都先用计划模式

计划模式意味着 Codex 不会立即执行。它会先头脑风暴、提出澄清问题、展示不同方案的权衡,然后生成一个编号计划供你在写代码之前审批。跳过计划模式是项目出错的最大原因。

有效的使用方法:

  • 描述目标,而不是步骤。 比如“从我的 YouTube 频道提取最近的评论并生成 Excel 报告”——而不是“用 Python 调用 YouTube API 然后写入 xlsx”。

  • 让它提问。 计划模式下的 Codex 通常会返回3-5个澄清问题。认真回答它们。每个问题都能帮你避免未来的 bug。

  • 执行前先批准计划。 仔细阅读步骤。如果发现问题——比如缺少边界情况处理、工具选择不当、不必要的复杂性——及时提出。在计划阶段修改比写完代码再改要省事得多。

计划模式与 AGENTS.md 配合效果特别好:配置文件中的约束条件会影响 Codex 提出的方案。两者结合可以大幅减少错误尝试。

04. 用 .env.local 管理 API 密钥

所有 API 密钥、秘密、凭证都要放在项目根目录的 .env.local 文件中。文件名前面的点不是装饰——这是告诉 Codex(和 git)要把这个文件排除在公开提交之外。

防止泄密的两条铁律:

  • 永远不要把密钥粘贴到随意命名的 secrets.txt 中,更不要直接粘贴到聊天消息里。这两种做法最终都会进入版本控制。一旦你推送代码,密钥就公开了。

  • 添加密钥后立即测试。 让 Codex 做一个最小的 API 调用来确认密钥有效。在它影响整个构建之前发现认证错误。

如果密钥真的不小心提交了,立即去服务提供商(Google Cloud、OpenAI 等)那里轮换密钥。不要只是从文件中删除然后推送删除操作——旧的提交记录里仍然有密钥,机器人会在几分钟内扫描 GitHub 提交记录来寻找泄露的秘密。唯一安全的做法是轮换凭证。

第二部分 · 连接与构建

05. 连接 MCP 服务器和插件

Codex 使用模型上下文协议(MCP)——这是一个开放标准,Claude Code 也在用。这意味着大多数现有的 MCP 服务器都可以在 Codex 中使用:GitHub、Slack、Notion、Linear、Drive、Figma,以及数十个社区开发的服务器。

这带来了什么变化:不再是向 Codex 描述你的数据,而是让它直接读取你的数据。不再是描述你想做什么操作,而是让它直接执行。对话从_“这是我代码仓库里的内容”<u>变成了</u>“用这个修复创建一个 PR 并通知负责人”_。

回报最快的三种用法:

  • GitHub MCP — 读取代码仓库、创建分支、发起 PR、评论问题。对任何开发者来说都是最直接的收益。

  • Vercel MCP — 部署、检查状态、回滚。与 GitHub 配合可以实现完整的“构建→提交→部署”循环。

  • Notion 或 Drive MCP — 提取内部文档作为上下文,将决策记录写回中央知识库。Codex 不再是黑盒,而是成为团队记忆的一部分。

06. 没有插件时,让 Codex 帮你设置 API

不是每个服务都有 MCP 服务器。YouTube Data API 没有。公司内部 API 没有。小众 SaaS 工具通常也没有。

遇到这种情况,你不需要去找第三方封装库。直接问 Codex。 在计划模式下,告诉它集成目标——比如“从我的 YouTube 频道提取最近的评论”。

它会返回不同选项(API 密钥 vs OAuth),推荐一个,然后生成分步计划来设置凭证、启用相关 API 并测试连接。

长期有效的做法:

  • 先尝试第一种方法。 Codex 会根据权衡选择一个方案。让它试。

  • 失败时记录教训。 比如“PowerShell 遇到 TLS 错误,Python 可以。把这个保存到项目记忆里,以后不要再试错误的路径。”下次对话会继承这些知识。

  • 锁定可用方案。 一旦某个集成稳定了,把它转换成 Skill(步骤9)。以后就不用重复设置了。

这是 AI 辅助工作中最重要的习惯。尝试、失败、记录失败、不再重复同样的错误。 Codex 的 AI 智能体默认只有短期记忆——它在本次对话中学到的东西明天就会忘记,除非你把它写下来。

每当遇到值得记录的经验教训时,告诉 Codex 更新 AGENTS.md 或项目记忆。 系统会越用越聪明。

07. 用具体的提示词构建真实的交付物

任何工具的价值都在于交付物。对大多数用户来说,第一个交付物通常是具体的东西——Excel 报告、自动化脚本、仪表板、生成的文档。能证明工具价值的东西。

决定第一次构建质量的关键因素:提示词的具体程度。 “分析我的 YouTube 评论”会生成一个只有“积极”、“消极”、“中性”分类的 Excel 表格,没什么用。“分析我的 YouTube 评论并按以下维度分类:工具对比、内容建议、技术问题、一般反馈——然后按回复优先级为我这个创作者排序”会生成一个你真正会用的工作簿。

快速提升输出质量的两个技巧:

  • 说明输出的用途 — “给我这个创作者用的”、“用于董事会汇报”、“给我的工程团队看的”。受众决定结构。

  • 列出你关心的分类或维度。 不要让分类依赖默认判断。告诉 Codex 你的分类体系。

如果第一版还可以但不够好,不要推倒重来。<u>增加更多细节然后重新运行。</u> 用更清晰的提示词迭代三轮,比从头开始五次要好。

08. 构建 UI 之前先用 gpt-image-2 生成概念图

Codex 内置了图像生成功能,使用的是 gpt-image-2——OpenAI 的图像模型。在提示词中用

$imagegen

显式调用,或者直接描述你需要什么,Codex 会自动识别。

生成的图像会成为项目资源,后续构建可以引用。

解锁这个功能的方法:在写 UI 代码之前先生成概念图。 让 Codex 先用一两张图模拟仪表板的外观。保存到项目里。

然后让它构建仪表板,并引用这些概念图。最终的视觉效果会比让模型凭空根据文字描述设计要好得多。

09. 将工作流转换成 Skills(技能)

Skill 是 Codex 按需加载的可重用配方。一旦你构建了一个有效的工作流——比如提取评论、生成报告、部署仪表板——就可以把它转换成 Skill,下次运行只需一条命令。

Codex 中的 Skills 是文件夹里的 markdown 文件。目录里有一个 SKILL.md 文件,包含前置元数据(名称+描述)和指令正文。可以选择性地在旁边放脚本和参考文件。

plaintext

---
name: youtube-comment-insights
description: 通过 Data API 提取最近的 YouTube 评论
  按内容类别和工具提及分类
  按回复优先级排序并输出带有
  摘要选项卡和图表的 Excel 工作簿每当我要求
  "评论洞察""每周 youtube 报告"时触发
---

# YouTube 评论洞察

## 设置
- .env.local 读取 YOUTUBE_API_KEY
- 获取最近10个视频的约200条最新评论

## 分类
- 类别工具对比内容建议技术问题
  一般反馈无关内容
- 工具提及跟踪CodexClaude CodeCursorAPIGPT
- 优先级信号问题 > 高互动评论 > 其他

## 输出
- 工作簿选项卡摘要分类工具提及
  优先回复内容创意原始数据
- 摘要选项卡上的图表类别分布工具排名

两个值得了解的存储级别:

  • 全局 Skills — 存储在 ~/.agents/skills/。在你电脑上的每个 Codex 项目中都可用。

  • 项目级 Skills — 存储在项目文件夹内。只在该项目中可用。适合客户专属或项目专属的配方。

决定 Skill 能否在需要时自动触发的三个因素:

  • 描述就是一切。 Codex 仅根据描述文本来匹配你的任务,以便隐式调用。把关键用例和触发词放在前面;模糊的描述永远不会触发。

  • 两种调用方式。 显式调用(CLI/IDE 中的 /skills,或

    $skillname

    提及),或隐式调用(当你的提示词与描述匹配时 Codex 自动选择技能)。

  • 开放标准。 Skills 在2025年12月为 Codex 推出,现在已经是跨平台 Agent Skills 标准的一部分——相同格式可以在 Codex、Claude Code、Gemini CLI、Cursor 中使用。写一次,到处运行。

10. 将本地服务部署到线上 <u>GitHub → Vercel → 生产环境</u>

Excel 表格是后端。仪表板是前端。Localhost 是开发地址。这些都不能直接交付。

要从本地到线上,你需要连接两个服务:GitHub 用于代码仓库,Vercel 用于托管。Codex 会协调整个流程。

plaintext

> 将此项目连接到 GitHub创建一个名为
  "yt-comments-dashboard" 的私有仓库并推送代码
Codex  使用 gh CLI 进行身份验证
  - 创建了 github.com/you/yt-comments-dashboard私有
  - 初始提交已推送
仓库就绪

> Vercel 连接到同一个 GitHub 账户
  导入此仓库部署
Codex  连接 Vercel
  - 已创建 vercel 项目
  - 构建在38秒内成功
已上线https://yt-comments-dashboard.vercel.app

关键细节:GitHub 和 Vercel 在初始连接后会持续通信。 每次推送到 main 分支都会触发 Vercel 自动部署。你不需要再登录 Vercel。你在 Codex 中工作,Codex 推送到 GitHub,Vercel 自动部署。三个工具,一个工作流。

11. 设置自动化任务——并明确指定模型

Codex 应用有一个自动化选项卡。可以按 cron 表达式运行定时任务。与 Skills 结合,这就是让仪表板“在你睡觉时自动更新”的方法。

一个真实的周日晚上自动化任务:提取新评论,运行洞察 Skill,更新 Excel 文件,推送新数据,让 Vercel 自动部署。端到端刷新,无需人工干预。到周一早上,仪表板已经是最新的了。

自动化面板里的模型选择器不会继承你活跃对话的设置。新建的自动化任务会使用面板的默认值,这可能比你实际想要的生产运行模型更慢更便宜。

为每个自动化任务明确设置模型,否则你会疑惑为什么原本7分钟的任务突然需要40分钟。如果你在本地打开了 Codex 需要覆盖的文件,也会出现同样的问题——先关闭它。

12. 选择正确的线程模式——Local、Worktree 或 Cloud

Codex 应用中的每个对话线程都运行在三种模式之一:

  • Local(本地) — 直接在你当前的项目目录中工作。最快、最简单,但每次更改都会影响实际的工作文件。适合小型、可控的编辑,当你信任 AI 智能体时使用。

  • Worktree(工作树) — 在 Git worktree(与同一仓库绑定的独立工作目录)中隔离更改。AI 智能体在单独的分支中工作,不会影响你的主分支。这是任何重要构建的默认选择。 如果运行出错,直接删除 worktree。零风险。

  • Cloud(云端) — 在配置的云环境中远程运行。你的笔记本电脑可以关机。将此与自动化任务(步骤11)配合,实现真正的异步工作流,不依赖你的机器在线。

经验法则:Worktree 用于重要工作,Local 用于小修小补,Cloud 用于长时间运行的自动化任务。三个信任级别,按任务选择。

13. 用内置浏览器做 QA 测试

构建完仪表板后,让 Codex 在内置浏览器中打开它,点击浏览,尝试找出问题,然后报告。它会做到。

它会发现你盯着代码看不出来的问题——失效的外部链接、看起来空荡荡的空状态、过于死板的搜索行为、可访问性缺陷、小的 UI 不一致。

把这从一次性操作变成习惯的方法:把 QA 测试写进你的项目记忆或 Skill 中

每次你发布新功能时,AI 智能体在返回给你之前先运行浏览器测试。你不再是 QA 测试员。AI 智能体做测试。你审查报告。

不过,浏览器不仅仅用于 QA。当 API 不存在时,它就是通用工具:

  • 登录没有 API 的工具 — 传统管理面板、供应商门户、内部仪表板。

  • 从不提供编程接口的仪表板中提取报告 — 分析视图、计费工具、状态页面。

  • 自动化你原本需要手动点击的多步 UI 流程。用自然语言描述步骤;Codex 执行它们。

14. 使用大多数人忽略的 UX 功能

Codex 应用有一些 UI 功能,能让它从“我用的工具”变成“我工作的环境”。它们单独看起来很小,加在一起效果显著。

  • 侧边对话。 从主对话中打开一个侧边线程。相同的项目上下文,不同的对话。快速提问而不污染主对话。用完就关。

  • 斜杠命令。 输入 / 浏览:/skills 显式调用 Skill,/clear,/help 等。斜杠菜单展示 Codex 的所有功能。

  • @ 提及。 在提示词中标记特定文件:“参考

    @example

    .tsx 添加一个新页面,列出来自

    @resources

    .ts 的项目。”比粘贴路径干净得多。

  • 模型切换器 + 推理强度。 聊天输入框下方的切换器可以按对话切换模型。推理强度控制 Codex 响应前思考多长时间。更高的强度 = 复杂任务表现更好,消耗更多 token,更快达到速率限制。根据任务匹配强度。

  • $imagegen

    ** + Skills 提及。** 输入 $ 以内联提及技能。与 @ 用于文件的语法相同。让你在一个提示词中组合多个技能。

  • 与 IDE 扩展的自动上下文同步。 如果在编辑器中安装了 Codex IDE 扩展,当两者都在同一项目中时,应用和编辑器会自动同步。你可以在编辑器内看到应用中运行的线程,反之亦然。切换“自动上下文”让 Codex 跟踪你正在查看的文件。

  • 完全访问模式。 设置 → 切换以跳过批准提示。更快,更危险。从默认开始。只有在你信任项目边界后才切换到完全访问。

让 Codex 只发挥3%潜力的习惯

  • 没有AGENTS.md. 每次对话都重新解释项目,每次得到不同的答案。

  • 跳过计划模式。 为了修复一句话的误解,改了四十个文件。

  • 把密钥放在聊天里或 secrets.txt 里。 一推送就公开了。

  • 从不记录教训。 一遍又一遍地犯同样的错误,因为什么都没写下来。

  • 模糊的提示词。 得到通用的交付物,然后惊讶于输出为什么这么通用。

  • 一次性构建。 每周从头重建相同的工作流,而不是把它转换成 Skill。

  • 所有事情都用 Local 模式。 一次糟糕的 AI 运行清空了你的工作文件,因为你没用 worktree。

  • 让自动化任务使用默认模型。 本该7分钟的任务跑了40分钟。

  • 没有 QA 测试。 发布的仪表板有失效链接和空荡荡的空状态。

  • 工具站队。 根据身份而不是眼前的任务选择 Codex vs Claude Code。两者各有优势,取决于具体情况。

总结

Codex 看起来像一个聊天窗口。但它不是聊天窗口。它是一个带有了解内容的 AI 智能体的文件夹——加上 Skills、MCP、自动化任务和浏览器层,所有这些都通过位于文件夹内的 markdown 文件进行配置。

这个文件夹是可移植的。 在 Codex、Claude Code、Cursor 或任何支持 Agent Skills 标准的工具中打开它。工具外壳变了,工作内容不变。

大多数用户会继续在聊天框里输入问题然后止步于此。他们会得到答案、复制代码、继续前进。用 Codex 真正发挥作用的400万周活跃用户,是那些配置好文件夹的人。

选一个你没做过的步骤——可能是 AGENTS.md,或者你的第一个真正的 Skill——明天就加上。

Codex 的输出取决于 Codex 的配置。