Codex

Codex 是一个云端软件工程 agent。

它可以并行处理多个任务,例如编写功能代码、回答代码库相关问题、修复 bug,以及提出 pull request 供你审核。


工作方式(How it works)

当你向 Codex 分配任务时:

  • 它会在一个隔离的云环境(sandbox)中运行
  • 该环境已预加载你的代码库

Codex 可以:

  • 读取和编辑文件
  • 运行命令(例如测试、lint)
  • 提交更改

每个任务都在独立环境中执行,从而避免相互影响。


核心能力(Capabilities)

  • 代码生成(Code generation) —— 根据需求编写代码
  • 代码理解(Code understanding) —— 分析现有代码库并回答问题
  • Bug 修复(Bug fixing) —— 定位并修复问题
  • 自动化 PR(Pull Requests) —— 自动生成可审核的代码变更
  • 多任务并行(Parallel tasks) —— 同时处理多个工程任务

使用方式(Usage)

你可以通过以下方式使用 Codex:

  • ChatGPT / Codex App
  • CLI(命令行工具)
  • SDK / API
  • IDE 集成(如 VS Code)

它通常作为一个coding agent(编程代理)存在,而不是简单的代码补全工具。


Agent 行为模型(Agent Model)

Codex 是一个agent 驱动系统,而不仅仅是一个模型:

  • 接收任务(Task)
  • 拆解步骤(Planning)
  • 执行操作(Execution)
  • 验证结果(Validation)
  • 提交结果(Commit / PR)

这意味着它更接近:

👉 “自动软件工程师” 而不是传统的 autocomplete(自动补全)


与 Git 的交互(Git behavior)

Codex 在处理代码时遵循一些约束:

  • 使用 Git 提交变更
  • 保持工作区(worktree)干净
  • 不修改已有提交
  • 所有评估基于已提交代码

(这些规则通常由系统 prompt / AGENTS.md 控制) ([OpenAI][1])


AGENTS.md 机制

Codex 支持一种特殊文件:

AGENTS.md

作用:

  • 提供项目级别的约束和说明
  • 指导 agent 如何工作

例如:

  • 代码规范
  • 项目结构说明
  • 测试执行方式
  • PR 提交规范

特点:

  • 作用范围 = 当前目录及其子目录
  • 多层嵌套时,更深层优先
  • 用户指令优先级 > AGENTS.md

运行环境(Execution Environment)

Codex 的执行环境具有以下特性:

  • 隔离(Sandboxed)
  • 可控权限(Permission-scoped)
  • 支持命令执行(Shell / CLI)
  • 可访问代码仓库

这使其可以执行:

  • 构建(build)
  • 测试(test)
  • 静态检查(lint)
  • 数据处理脚本

安全模型(Security Model)

由于 Codex 可以执行代码:

  • 需要限制 token 权限
  • 需要隔离执行环境
  • 避免 prompt injection / command injection

(现实中确实出现过相关漏洞案例) ([TechRadar][2])


与 Copilot 的关系

  • Codex 是底层能力之一
  • GitHub Copilot 使用类似模型提供代码补全
  • Codex 更偏向 Agent(执行任务)
  • Copilot 更偏向 IDE 辅助(补全) ([GitHub Docs][3])

总结(核心定位)

Codex 的本质是:

从 “写代码工具” → “执行工程任务的 AI Agent”

它解决的是:

  • 自动开发(Auto Dev)
  • 自动修复(Auto Fix)
  • 自动提交(Auto PR)
  • 自动理解代码库(Codebase Intelligence)

一句话理解

👉 Codex ≈ “会自己写代码 + 跑测试 + 提 PR 的 AI 工程师”

参考资料