AI Agent

AI Agent 是能基于目标、上下文和工具执行多步骤任务的 LLM 系统。它不是“更聪明的聊天机器人”,而是一个带工具、状态、权限和评估的工作流。

一个实用定义

Agent = LLM + tools + state + workflow + harness + loop + guardrails + evaluation

其中:

Agent 和普通 Chatbot 的区别

能力 Chatbot Agent
回答问题 可以 可以
调用工具 通常没有 核心能力
多步骤任务 需要 workflow
状态管理 对话历史为主 显式任务状态
权限控制 较少 必须
可观测性 可选 必须

什么时候需要 Agent

适合:

不适合:

这些场景优先用 Prompt、RAG 或普通程序解决。

Agent 的核心组件

工具

工具要有清晰 schema、权限和错误格式。见 Agent 工具调用

状态

状态记录:

工作流

工作流决定 Agent 如何推进。见 Agent 工作流模式

记忆与上下文

Agent 要知道项目规则、任务状态和长期偏好。见 Agent 记忆与上下文

Harness

Harness 是模型外部的工程系统,包括工具、文件系统、shell、权限、CI、日志和人类 review。见 Harness Engineering

Loop

Loop 决定 Agent 如何基于反馈反复执行、验证和停止。见 Loop Engineering

评估

Agent 评估要覆盖:

最小工具型 Agent 流程

用户:查一下这篇文档里 RAG 评估怎么做
  -> 模型决定调用 search_docs
  -> 程序校验 query 和 top_k
  -> 工具返回相关片段
  -> 模型基于片段回答并给引用

注意:工具执行必须由程序控制,不能让模型绕过权限和参数校验。

主要风险

风险 说明 控制
工具误用 调错工具或参数 schema、校验、eval
越权操作 调用不该调用的系统 权限层、人工确认
循环失控 反复调用工具 最大步数、超时
幻觉动作结果 没按 observation 回答 结构化工具结果、引用检查
prompt injection 文档诱导模型忽略规则 不信任外部内容、权限隔离
成本失控 多轮调用和重试 路由、缓存、预算

学习顺序

  1. Agent 工具调用与结构化输出
  2. Agent 工作流模式
  3. AI 编程智能体
  4. Agent 记忆与上下文
  5. MCP:Agent 的工具与上下文协议
  6. Harness Engineering
  7. Loop Engineering
  8. Agent 生产化

如果你还没有做过 RAG,建议先学 RAG,因为很多 Agent 都会把检索作为基础工具。

参考资料