Codex
Codex 是一个云端软件工程 agent。
它可以并行处理多个任务,例如编写功能代码、回答代码库相关问题、修复 bug,以及提出 pull request 供你审核。
工作方式(How it works)
当你向 Codex 分配任务时:
- 它会在一个隔离的云环境(sandbox)中运行
- 该环境已预加载你的代码库
Codex 可以:
- 读取和编辑文件
- 运行命令(例如测试、lint)
- 提交更改
每个任务都在独立环境中执行,从而避免相互影响。
核心能力(Capabilities)
- 代码生成(Code generation) —— 根据需求编写代码
- 代码理解(Code understanding) —— 分析现有代码库并回答问题
- Bug 修复(Bug fixing) —— 定位并修复问题
- 自动化 PR(Pull Requests) —— 自动生成可审核的代码变更
- 多任务并行(Parallel tasks) —— 同时处理多个工程任务
使用方式(Usage)
你可以通过以下方式使用 Codex:
- ChatGPT / Codex App
- CLI(命令行工具)
- SDK / API
- IDE 集成(如 VS Code)
它通常作为一个coding agent(编程代理)存在,而不是简单的代码补全工具。
Agent 行为模型(Agent Model)
Codex 是一个agent 驱动系统,而不仅仅是一个模型:
- 接收任务(Task)
- 拆解步骤(Planning)
- 执行操作(Execution)
- 验证结果(Validation)
- 提交结果(Commit / PR)
这意味着它更接近:
👉 “自动软件工程师” 而不是传统的 autocomplete(自动补全)
与 Git 的交互(Git behavior)
Codex 在处理代码时遵循一些约束:
- 使用 Git 提交变更
- 保持工作区(worktree)干净
- 不修改已有提交
- 所有评估基于已提交代码
(这些规则通常由系统 prompt / AGENTS.md 控制) ([OpenAI][1])
AGENTS.md 机制
Codex 支持一种特殊文件:
AGENTS.md
作用:
- 提供项目级别的约束和说明
- 指导 agent 如何工作
例如:
- 代码规范
- 项目结构说明
- 测试执行方式
- PR 提交规范
特点:
- 作用范围 = 当前目录及其子目录
- 多层嵌套时,更深层优先
- 用户指令优先级 > AGENTS.md
运行环境(Execution Environment)
Codex 的执行环境具有以下特性:
- 隔离(Sandboxed)
- 可控权限(Permission-scoped)
- 支持命令执行(Shell / CLI)
- 可访问代码仓库
这使其可以执行:
- 构建(build)
- 测试(test)
- 静态检查(lint)
- 数据处理脚本
安全模型(Security Model)
由于 Codex 可以执行代码:
- 需要限制 token 权限
- 需要隔离执行环境
- 避免 prompt injection / command injection
(现实中确实出现过相关漏洞案例) ([TechRadar][2])
与 Copilot 的关系
- Codex 是底层能力之一
- GitHub Copilot 使用类似模型提供代码补全
- Codex 更偏向 Agent(执行任务)
- Copilot 更偏向 IDE 辅助(补全) ([GitHub Docs][3])
总结(核心定位)
Codex 的本质是:
从 “写代码工具” → “执行工程任务的 AI Agent”
它解决的是:
- 自动开发(Auto Dev)
- 自动修复(Auto Fix)
- 自动提交(Auto PR)
- 自动理解代码库(Codebase Intelligence)
一句话理解
👉 Codex ≈ “会自己写代码 + 跑测试 + 提 PR 的 AI 工程师”
