AI 编程智能体:Codex、Claude Code 与协作模式
AI 编程智能体不是单纯的代码补全工具。它们能读取代码库、编辑多个文件、运行命令、检查 diff、生成提交说明,甚至把任务交给云端或子 Agent 执行。学习 Agent 工程时,Codex、Claude Code、GitHub Copilot Coding Agent、Cursor 等工具是最容易落地的观察对象。
本章重点不是“哪个工具最强”,而是理解这些工具背后的工程范式:上下文、工具、权限、反馈环、评估和人类审查。
编程智能体解决什么问题
| 场景 | 传统方式 | 编程智能体方式 |
|---|---|---|
| 熟悉陌生代码库 | 人读目录、搜文件、跑测试 | Agent 先探索,再给结构化说明 |
| 修 bug | 人定位、改代码、跑测试 | Agent 复现、定位、修改、验证 |
| 补测试 | 人找边界条件 | Agent 读实现和历史测试,补覆盖 |
| 重构 | 人维护大量上下文 | Agent 分步骤修改并保持 diff 可审 |
| 文档同步 | 人手动更新 | Agent 根据代码变更补 README/API 文档 |
| PR review | 人逐文件看 diff | Agent 做第一轮风险扫描和建议 |
编程智能体最适合处理“上下文大、步骤多、需要验证”的软件工程任务。
代表工具
Codex
Codex 是 OpenAI 的编程智能体。官方文档把 Codex CLI 定义为可以在终端本地运行、读取/修改/运行当前目录代码的 coding agent;Codex IDE extension 则在 IDE 侧边栏工作,也可以把任务委托给 Codex Cloud。
Codex 的重要能力:
- CLI、IDE extension、Codex app、Web/Cloud 等多种表面。
- 能读写本地代码、运行命令、做 code review。
- 支持 MCP,让 Codex 接入第三方文档和开发工具。
- 支持 Skills,把可复用工作流打包成说明、脚本和资源。
- 支持 Subagents,把高度并行的探索或 review 任务拆给多个专门 Agent。
- 通过 AGENTS.md、规则、权限、沙箱和配置文件约束行为。
适合:
- 终端或 IDE 中的端到端代码任务。
- 代码库探索、bug fix、重构、测试、PR review。
- 需要本地命令、浏览器、MCP、skills 或子 Agent 协作的任务。
Claude Code
Claude Code 是 Anthropic 的 agentic coding tool。官方文档描述它可以读取代码库、编辑文件、运行命令,并集成到终端、IDE、桌面、浏览器等环境中。
Claude Code 的重要能力:
- CLI、VS Code、JetBrains、Desktop、Web 等多种入口。
- 能直接处理代码库任务,如写测试、修 lint、解决 merge conflict、更新依赖、写 release notes。
- 支持 CLAUDE.md、auto memory、skills、hooks、subagents、MCP。
- 支持 hooks,在生命周期关键点执行确定性 shell 命令,例如编辑后格式化、执行前阻断危险命令、任务完成后通知。
- 支持多 Agent、background agents、Agent SDK 和 scheduled tasks。
适合:
- 终端驱动的代码任务。
- 需要 hooks、记忆、定时任务、CI/PR 自动化的团队工作流。
- 希望把 Claude Code 能力嵌进自定义 Agent SDK 工作流的场景。
GitHub Copilot Coding Agent
适合从 GitHub Issue、PR 或 IDE 里触发代码修改。它的强项是贴近 GitHub 工作流:issue 到 branch、PR、review、CI。
Cursor / Windsurf / IDE Agent
适合强交互开发:你在编辑器里保持上下文,Agent 辅助理解、改代码、跑局部任务。
怎么选工具
| 需求 | 优先考虑 |
|---|---|
| 终端里完成本地代码任务 | Codex CLI、Claude Code CLI |
| IDE 内边写边改 | Codex IDE、Claude Code IDE、Cursor |
| 多任务并行和云端执行 | Codex Cloud、Claude Code Web/Desktop/background agents |
| GitHub issue 到 PR | GitHub Copilot Coding Agent、Codex GitHub 集成、Claude Code CI/CD |
| 强规则和自动化钩子 | Claude Code hooks、Codex hooks/permissions |
| 可复用工作流 | Codex Skills、Claude Skills、插件 |
| 外部工具和私有系统 | MCP |
编程 Agent 的使用模式
1. Exploration mode
让 Agent 先读代码库,不改文件。
请先探索这个仓库的结构,说明主要模块、测试命令、构建命令,以及修改用户认证逻辑可能涉及哪些文件。不要修改代码。
价值:
- 快速建立代码地图。
- 发现测试入口和风险区域。
- 降低直接修改造成的偏差。
2. Plan-first mode
先要求计划,再批准执行。
目标:修复用户登录失败时错误提示不准确的问题。
请先给出修改计划、涉及文件、测试方案和风险点,等我确认后再改代码。
适合:
- 影响面不确定的改动。
- 需要和人类对齐设计的任务。
3. Patch-and-test mode
让 Agent 修改后必须运行验证。
请实现这个修复,并运行相关单元测试。如果测试失败,先解释失败原因,再决定是否继续修改。
关键是把“完成”的定义写清楚:代码改了不算完,验证通过才算。
4. Review mode
让 Agent 扮演 reviewer,而不是 author。
请 review 当前分支相对 master 的 diff。重点找 bug、回归风险、安全问题和缺失测试。不要重写代码。
适合:
- PR 前自检。
- 人类 review 前减轻低级错误。
5. Multi-agent mode
把可以并行的问题拆开。
请为当前 PR 启动多个独立检查:安全、测试覆盖、性能、可维护性。每个检查独立分析,最后汇总结论。
注意:多 Agent 会增加 token 和工具成本,适合复杂任务,不适合简单修改。
编程 Agent 的关键输入
| 输入 | 作用 |
|---|---|
| 目标 | 做什么,不做什么 |
| 验收标准 | 什么结果算完成 |
| 代码范围 | 哪些目录/文件可以改 |
| 测试命令 | 怎么验证 |
| 风格约束 | 命名、架构、依赖、错误处理 |
| 安全边界 | 不能执行哪些命令,不能访问哪些数据 |
| 提交规范 | commit message、PR 模板、review 要点 |
这些输入最好沉淀到 AGENTS.md、CLAUDE.md、规则文件、skills 或 hooks 中,而不是每次临时口头补充。
常见错误
让 Agent 直接“大改一下”
修复:先要求探索和计划,限制文件范围,给出测试命令。
没有验证闭环
修复:每个任务都要绑定 lint、test、typecheck、build 或人工验收。
规则只写在聊天里
修复:把稳定规则写入仓库文件,例如 AGENTS.md、CLAUDE.md、项目 README、CI 脚本。
忽略权限
修复:高风险命令、生产数据、密钥、部署动作必须人工确认。
把 Agent 输出当作最终答案
修复:保留 diff review、测试日志、trace 和 reviewer 责任。
和 Agent 工程的关系
编程 Agent 是最典型的 Agent 工程实验场:
- 文件系统、shell、git、浏览器、issue tracker 都是工具。
AGENTS.md/CLAUDE.md是长期上下文。- hooks / CI / tests 是反馈环。
- subagents 是并行任务分解。
- PR review 是人类监督。
因此,学会使用编程 Agent,本质上就是在学习 Agent harness 和 loop 的设计。
下一步
- 学 Harness Engineering:设计 Agent 外部系统。
- 学 Loop Engineering:设计迭代、验证和停止条件。
- 学 MCP:把 Agent 接入工具和数据源。
- 学 Agent 记忆与上下文:把项目规则持久化。
参考资料
- OpenAI Codex CLI: https://developers.openai.com/codex/cli
- OpenAI Codex IDE extension: https://developers.openai.com/codex/ide
- OpenAI Codex MCP: https://developers.openai.com/codex/mcp
- OpenAI Codex Skills: https://developers.openai.com/codex/skills
- OpenAI Codex Subagents: https://developers.openai.com/codex/subagents
- Claude Code Overview: https://docs.anthropic.com/en/docs/claude-code/overview
- Claude Code Hooks: https://docs.anthropic.com/en/docs/claude-code/hooks-guide
- Claude Code MCP: https://docs.anthropic.com/en/docs/claude-code/mcp
- Claude Code Subagents: https://docs.anthropic.com/en/docs/claude-code/sub-agents