ai-agent 是什么？

老马啸西风2026/1/8大约 4 分钟

前言

大家好，我是老马。

我们首先来学习一下 ai-agent

一、什么是 AI Agent（智能体）

AI Agent 是一种能够：

感知环境（Perception）
自主决策（Decision Making）
采取行动（Action）
基于反馈持续迭代（Learning / Reflection）

的 自治型智能系统。

一句话定义：

AI Agent = LLM + 目标 + 记忆 + 工具 + 规划 + 反馈闭环

它不是一次性“问答模型”，而是一个可以长期运行、主动做事、对结果负责的系统。

二、为什么需要 AI Agent（它解决了什么问题）

传统 LLM 的本质是：

输入 Prompt
输出文本
无状态、无长期目标、无执行能力

而现实世界的问题是：

目标往往是复杂、模糊、长期的
需要多步推理
需要调用外部系统
需要失败重试与策略调整

AI Agent 的价值在于：

能力	LLM	AI Agent
多轮思考	有限	内建
长期目标	❌	✅
自主规划	❌	✅
工具调用	手动	自动
状态记忆	无	有
失败修正	无	有

三、AI Agent 的核心能力拆解

1. 目标驱动（Goal-oriented）

Agent 不是“回答问题”，而是：

接收一个目标
判断是否完成
未完成则持续行动

例如：

“把这个 Java 项目升级到 Spring Boot 3，并通过所有测试。”

2. 自主规划（Planning）

Agent 会将目标拆解为子任务：

目标
 ├─ 分析项目结构
 ├─ 升级依赖
 ├─ 修改不兼容代码
 ├─ 执行测试
 ├─ 修复失败用例
 └─ 生成升级报告

常见规划方式：

ReAct（Reason + Act）
Plan-and-Execute
Tree of Thoughts
Hierarchical Task Network（HTN）

3. 工具使用（Tool Use）

AI Agent 能“真正做事”，依赖工具：

文件系统
Shell / CLI
IDE / Git
HTTP API
数据库
浏览器（Playwright / Selenium）

工具 ≈ Agent 的“手脚”。

4. 状态与记忆（Memory）

Agent 具备多层记忆结构：

类型	作用
短期记忆	当前上下文
工作记忆	当前任务状态
长期记忆	历史经验、偏好
外部记忆	向量库 / 知识库

这使 Agent 具备持续进化能力。

5. 反馈与自我修正（Reflection）

Agent 会：

评估结果是否满足目标
分析失败原因
调整策略
重试

这就是“Agentic Loop”。

四、AI Agent 的典型技术架构

一个工程化的 AI Agent，通常是这样的结构：

┌──────────────────────┐
│        Goal          │
└─────────┬────────────┘
          ↓
┌──────────────────────┐
│      Planner         │  ← 任务分解
└─────────┬────────────┘
          ↓
┌──────────────────────┐
│      Reasoner        │  ← 推理/决策（LLM）
└─────────┬────────────┘
          ↓
┌──────────────────────┐
│   Tool Executor      │  ← 执行行动
└─────────┬────────────┘
          ↓
┌──────────────────────┐
│   Environment        │  ← 代码、系统、世界
└─────────┬────────────┘
          ↓
┌──────────────────────┐
│    Evaluator         │  ← 结果评估
└─────────┬────────────┘
          ↺（反馈循环）