第 60 篇 · Agent与自主系统

Agent：能自主行动的AI

以前的AI只能回答问题，现在的Agent能主动思考、规划、执行任务

想象你有一个助手。你问它：「今天天气怎么样？」它回答：「晴，25度。」

这很正常，对吧？但如果这个助手能主动查看你的日历，发现你下午有户外活动，然后提醒你：「今天下午有户外团建，记得带防晒霜。」甚至它能直接帮你买一瓶防晒霜，送到你的办公室——这就是Agent。

普通的AI只会回答问题。Agent会思考、会规划、会行动。

1
什么是Agent？

传统AI vs Agent 对比

💭

传统AI

❓

你问什么，它答什么

🔒

被动响应，不能执行任务

🚫

无法自主规划

"今天天气？"

→ 只回答天气

🤖

Agent

🎯

你给目标，它想办法

🔧

调用工具执行任务

🧠

自主规划步骤

"订明天去上海的机票"

→ 自动完成订票

Agent（智能体）是一个能自主感知、规划、行动的AI系统。它不只是回答你的问题，而是能独立完成一系列复杂任务。

2
Agent的三大核心能力

感知👁️

Perception

Agent要能「看到」环境。理解请求、读取文件、访问数据库、获取网页内容。感知是Agent认识世界的方式。

规划🧠

Planning

Agent要能「思考」如何完成任务。分解目标、制定步骤、评估风险、调整策略。规划是Agent的核心智能。

行动🦾

Action

Agent要能「动手」做事情。调用工具、发送邮件、操作文件、执行代码。行动是Agent改变世界的方式。

Agent的工作循环

💡 关键洞察：Agent的工作是一个循环。感知→规划→行动→感知，不断迭代。如果行动失败，它会调整策略，再次尝试。这种「反思-调整」的能力，是Agent和传统AI的本质区别。

3
一个真实的例子

订机票场景：Agent如何工作

1️⃣

感知

读取你的日历，发现明天下午有会议

→ 只能订早上的航班

2️⃣

规划

制定计划：查询航班→筛选时间→对比价格→完成预订

3️⃣

行动

调用航班查询API、比价工具、订票系统

→ 完成订票

4️⃣

反馈

如果订票失败（票已售完），自动选择其他航班

🎯 整个过程，你只说了一句话

Agent会自动完成所有中间步骤。这就是Agent的价值——让AI从「回答者」变成「执行者」。

4
Agent的应用场景

Agent正在改变这些领域

💼

智能客服

不只回答问题，还能查询订单、处理退款、联系人工客服

📊

数据分析

自动收集数据、清洗整理、生成报告、发现异常

🔬

科研助手

自动检索文献、总结论文、设计实验、分析数据

🎮

游戏AI

在开放世界游戏中自主探索、完成任务、与环境交互

5
常见误区

❌

误区1：Agent = LLM

不是的。LLM（大语言模型）只是Agent的「大脑」。Agent还需要工具、记忆、规划能力，才能成为完整的智能体。

❌

误区2：Agent能做任何事

Agent的能力受限于它拥有的工具。没有订票工具，它就订不了票。没有邮件工具，它就发不了邮件。

❌

误区3：Agent永远不会犯错

Agent会犯错，比如误解你的意图、选择错误的工具、制定糟糕的计划。但它能从错误中学习，调整策略。

6
总结

🎓 一句话总结

①Agent是能自主感知、规划、行动的AI系统
②与传统AI不同，Agent会主动思考如何完成任务
③Agent的三大核心：感知、规划、行动
④Agent的能力取决于它拥有的工具

📚
延伸阅读

Agent知识地图

📖

已掌握

✓ Agent是什么
✓ 三大核心能力
✓ 工作循环
✓ 应用场景

🔄

• 工具调用机制
• 工具定义
• 工具选择
• 工具执行

🔮

未来学习

• 记忆系统
• 规划算法
• 多Agent协作
• Agent框架

→
下篇预告

第61篇：工具调用——让AI能使用工具

既然Agent需要工具才能行动，那它如何使用工具呢？下一篇，我们来聊聊工具调用——让AI能调用各种工具的机制。

✏️ 手绘图解 · AI Catch 出品

第 60 篇 / 共 84 篇