AI 编程智能体:Codex、Claude Code 与协作模式

AI 编程智能体不是单纯的代码补全工具。它们能读取代码库、编辑多个文件、运行命令、检查 diff、生成提交说明,甚至把任务交给云端或子 Agent 执行。学习 Agent 工程时,Codex、Claude Code、GitHub Copilot Coding Agent、Cursor 等工具是最容易落地的观察对象。

本章重点不是“哪个工具最强”,而是理解这些工具背后的工程范式:上下文、工具、权限、反馈环、评估和人类审查。

编程智能体解决什么问题

场景 传统方式 编程智能体方式
熟悉陌生代码库 人读目录、搜文件、跑测试 Agent 先探索,再给结构化说明
修 bug 人定位、改代码、跑测试 Agent 复现、定位、修改、验证
补测试 人找边界条件 Agent 读实现和历史测试,补覆盖
重构 人维护大量上下文 Agent 分步骤修改并保持 diff 可审
文档同步 人手动更新 Agent 根据代码变更补 README/API 文档
PR review 人逐文件看 diff Agent 做第一轮风险扫描和建议

编程智能体最适合处理“上下文大、步骤多、需要验证”的软件工程任务。

代表工具

Codex

Codex 是 OpenAI 的编程智能体。官方文档把 Codex CLI 定义为可以在终端本地运行、读取/修改/运行当前目录代码的 coding agent;Codex IDE extension 则在 IDE 侧边栏工作,也可以把任务委托给 Codex Cloud。

Codex 的重要能力:

适合:

Claude Code

Claude Code 是 Anthropic 的 agentic coding tool。官方文档描述它可以读取代码库、编辑文件、运行命令,并集成到终端、IDE、桌面、浏览器等环境中。

Claude Code 的重要能力:

适合:

GitHub Copilot Coding Agent

适合从 GitHub Issue、PR 或 IDE 里触发代码修改。它的强项是贴近 GitHub 工作流:issue 到 branch、PR、review、CI。

Cursor / Windsurf / IDE Agent

适合强交互开发:你在编辑器里保持上下文,Agent 辅助理解、改代码、跑局部任务。

怎么选工具

需求 优先考虑
终端里完成本地代码任务 Codex CLI、Claude Code CLI
IDE 内边写边改 Codex IDE、Claude Code IDE、Cursor
多任务并行和云端执行 Codex Cloud、Claude Code Web/Desktop/background agents
GitHub issue 到 PR GitHub Copilot Coding Agent、Codex GitHub 集成、Claude Code CI/CD
强规则和自动化钩子 Claude Code hooks、Codex hooks/permissions
可复用工作流 Codex Skills、Claude Skills、插件
外部工具和私有系统 MCP

编程 Agent 的使用模式

1. Exploration mode

让 Agent 先读代码库,不改文件。

请先探索这个仓库的结构,说明主要模块、测试命令、构建命令,以及修改用户认证逻辑可能涉及哪些文件。不要修改代码。

价值:

2. Plan-first mode

先要求计划,再批准执行。

目标:修复用户登录失败时错误提示不准确的问题。
请先给出修改计划、涉及文件、测试方案和风险点,等我确认后再改代码。

适合:

3. Patch-and-test mode

让 Agent 修改后必须运行验证。

请实现这个修复,并运行相关单元测试。如果测试失败,先解释失败原因,再决定是否继续修改。

关键是把“完成”的定义写清楚:代码改了不算完,验证通过才算。

4. Review mode

让 Agent 扮演 reviewer,而不是 author。

请 review 当前分支相对 master 的 diff。重点找 bug、回归风险、安全问题和缺失测试。不要重写代码。

适合:

5. Multi-agent mode

把可以并行的问题拆开。

请为当前 PR 启动多个独立检查:安全、测试覆盖、性能、可维护性。每个检查独立分析,最后汇总结论。

注意:多 Agent 会增加 token 和工具成本,适合复杂任务,不适合简单修改。

编程 Agent 的关键输入

输入 作用
目标 做什么,不做什么
验收标准 什么结果算完成
代码范围 哪些目录/文件可以改
测试命令 怎么验证
风格约束 命名、架构、依赖、错误处理
安全边界 不能执行哪些命令,不能访问哪些数据
提交规范 commit message、PR 模板、review 要点

这些输入最好沉淀到 AGENTS.mdCLAUDE.md、规则文件、skills 或 hooks 中,而不是每次临时口头补充。

常见错误

让 Agent 直接“大改一下”

修复:先要求探索和计划,限制文件范围,给出测试命令。

没有验证闭环

修复:每个任务都要绑定 lint、test、typecheck、build 或人工验收。

规则只写在聊天里

修复:把稳定规则写入仓库文件,例如 AGENTS.mdCLAUDE.md、项目 README、CI 脚本。

忽略权限

修复:高风险命令、生产数据、密钥、部署动作必须人工确认。

把 Agent 输出当作最终答案

修复:保留 diff review、测试日志、trace 和 reviewer 责任。

和 Agent 工程的关系

编程 Agent 是最典型的 Agent 工程实验场:

因此,学会使用编程 Agent,本质上就是在学习 Agent harness 和 loop 的设计。

下一步

参考资料