Codex

Codex 是一个云端软件工程 agent。

它可以并行处理多个任务，例如编写功能代码、回答代码库相关问题、修复 bug，以及提出 pull request 供你审核。

工作方式（How it works）

当你向 Codex 分配任务时：

它会在一个隔离的云环境（sandbox）中运行
该环境已预加载你的代码库

Codex 可以：

读取和编辑文件
运行命令（例如测试、lint）
提交更改

每个任务都在独立环境中执行，从而避免相互影响。

核心能力（Capabilities）

代码生成（Code generation） —— 根据需求编写代码
代码理解（Code understanding） —— 分析现有代码库并回答问题
Bug 修复（Bug fixing） —— 定位并修复问题
自动化 PR（Pull Requests） —— 自动生成可审核的代码变更
多任务并行（Parallel tasks） —— 同时处理多个工程任务

使用方式（Usage）

你可以通过以下方式使用 Codex：

ChatGPT / Codex App
CLI（命令行工具）
SDK / API
IDE 集成（如 VS Code）

它通常作为一个coding agent（编程代理）存在，而不是简单的代码补全工具。

Agent 行为模型（Agent Model）

Codex 是一个agent 驱动系统，而不仅仅是一个模型：

接收任务（Task）
拆解步骤（Planning）
执行操作（Execution）
验证结果（Validation）
提交结果（Commit / PR）

这意味着它更接近：

👉 “自动软件工程师” 而不是传统的 autocomplete（自动补全）

与 Git 的交互（Git behavior）

Codex 在处理代码时遵循一些约束：

使用 Git 提交变更
保持工作区（worktree）干净
不修改已有提交
所有评估基于已提交代码

（这些规则通常由系统 prompt / AGENTS.md 控制） ([OpenAI][1])

AGENTS.md 机制

Codex 支持一种特殊文件：

AGENTS.md

作用：

提供项目级别的约束和说明
指导 agent 如何工作

例如：

代码规范
项目结构说明
测试执行方式
PR 提交规范

特点：

作用范围 = 当前目录及其子目录
多层嵌套时，更深层优先
用户指令优先级 > AGENTS.md

运行环境（Execution Environment）

Codex 的执行环境具有以下特性：

隔离（Sandboxed）
可控权限（Permission-scoped）
支持命令执行（Shell / CLI）
可访问代码仓库

这使其可以执行：

构建（build）
测试（test）
静态检查（lint）
数据处理脚本

安全模型（Security Model）

由于 Codex 可以执行代码：

需要限制 token 权限
需要隔离执行环境
避免 prompt injection / command injection

（现实中确实出现过相关漏洞案例） ([TechRadar][2])

与 Copilot 的关系

Codex 是底层能力之一
GitHub Copilot 使用类似模型提供代码补全
Codex 更偏向 Agent（执行任务）
Copilot 更偏向 IDE 辅助（补全） ([GitHub Docs][3])

总结（核心定位）

Codex 的本质是：

从 “写代码工具” → “执行工程任务的 AI Agent”

它解决的是：

自动开发（Auto Dev）
自动修复（Auto Fix）
自动提交（Auto PR）
自动理解代码库（Codebase Intelligence）

一句话理解

👉 Codex ≈ “会自己写代码 + 跑测试 + 提 PR 的 AI 工程师”

参考资料

Codex
参考资料