什么是AI 智能体 Agent

📅 2026/6/30 22:46:59
什么是AI 智能体 Agent
目录01 什么是 Agent从被动生成到主动执行02 核心技术组件Function Calling / Tool Use / MCP03 Agent 复杂度分级从 Toy 到 Platform 四级跃迁04 Agent Harness生产级智能体脚手架的 12 大核心组件05 主流框架全景6 大框架横向对比与选型06 企业应用架构五层架构与三层企业数字化07 落地路径与创业机会垂直领域 Agent 的黄金窗口01 什么是 Agent从被动生成到主动执行LLM vs Agent从知道到做到LLM大语言模型Agent智能体基于海量数据的语言模型LLM 工具 记忆 规划输入问题 → 生成回答输入任务 → 自主执行 → 交付结果本质是知识储备本质是行动能力像一个读过很多书的学者像一个有双手和经验的工程师Agent 公式Agent LLM大脑 工具双手 记忆经验 规划策略组件职责LLM负责理解和决策 → 大脑工具API/函数负责执行操作 → 双手记忆系统短期长期负责保持上下文 → 经验规划能力负责多步推理和任务分解 → 策略Agent vs RAG解决不同维度的问题RAG检索增强生成Agent智能体解决知识不足问题解决行动力不足问题检索 → 增强 → 生成规划 → 执行 → 观察 → 循环让 LLM 获取更多上下文让 LLM 能够执行操作应用场景问答系统、知识库应用场景自动化工作流、决策系统核心给模型更多知识核心给模型行动能力混合架构RAG AgentRAG 作为 Agent 的工具之一 → Agent Skills 模式Agent 决定何时检索、如何检索、检索后如何推理Agent Skills 比传统 RAG 效果更好动态检索策略、上下文感知的检索增强RAG 给 Agent 提供知识库Agent 让 RAG 从被动变主动检索不是问题问题是该检索什么、何时检索、检索后怎么做02 核心技术组件Function Calling / Tool Use / MCPFunction Calling函数调用LLM 输出结构化 JSON 指令告诉外部系统该调用什么函数、传什么参数LLM 不直接执行而是做决策调度器典型流程用户请求 → LLM 决策 → 生成 JSON → 外部执行 → 结果返回 LLM这是 Agent 的最小可行单元Tool Use工具使用Function Calling 的泛化形式不仅限于函数调用可以是任何外部能力包括搜索引擎、代码解释器、数据库查询、API 调用Tool Use Function Calling 更多类型的外部工具本质LLM 学会了使用工具而非记住一切MCPModel Context Protocol标准化协议AI 模型与外部工具之间的USB-C 接口解决工具发现、连接、授权的标准问题让企业现有微服务 API 可以被 AI 工具发现和使用三层架构Protocol协议→ Transport传输→ Server服务核心愿景一个协议连接所有 AI 工具和数据源03 Agent 复杂度分级从 Toy 到 Platform 四级跃迁级别类型说明能力L1Toy演示级 Agent单个 LLM 1-2 个函数能完成简单任务演示L2Tool工具级 Agent多个工具编排有基本错误处理能完成特定领域任务L3System系统级 Agent多 Agent 协作完整记忆系统自主规划和调整L4Platform平台级 AgentAgent 生态可编排、可监控支持企业级规模⚠️ L1 的风险过度承诺实际能力有限04 Agent Harness生产级智能体脚手架的 12 大核心组件Harness 12 个核心组件让 LLM 变成可靠的生产级 Agent#组件职责1Orchestration Loop控制流引擎决定何时调用工具、何时返回结果、何时循环2Tool Registry工具注册中心管理所有可用工具的描述、参数、权限3Short-term Memory短期记忆对话上下文、工具执行结果的历史记录4Long-term Memory长期记忆向量数据库、知识库、用户偏好学习5Context Manager上下文管理控制 Token 使用、上下文窗口管理6State Persistence状态持久化Agent 执行状态的保存和恢复7Error Handler错误处理工具失败重试、降级策略、异常恢复8Guardrails安全护栏内容过滤、权限控制、输入输出验证9Observability可观测性执行链路追踪、日志、性能监控10Prompt Manager提示词管理模板版本控制、A/B 测试、动态注入11Eval Monitor评估与监控质量评估、准确率监控、用户反馈12Config System配置系统环境配置、特性开关、参数调优05 主流框架全景6 大框架横向对比与选型六大主流 Agent 框架框架定位优势局限OpenAI Agents SDK官方出品简单直接适合快速原型生态绑定 OpenAILangGraph图结构编排状态管理强社区最大学习曲线中等CrewAI多 Agent 协作角色分工明确业务导向抽象层级较高LlamaIndex数据优先RAG 集成好索引能力强适合数据密集型PydanticAI类型安全Pydantic 生态开发者体验好新兴框架Semantic Kernel微软支持企业级支持多 LLM微软生态集成—重要动态AutoGen 已进入维护模式Microsoft 推荐转向 Agent Framework框架选择不是永久性的 → 核心概念记忆、工具、规划跨框架通用选型建议从 L2 工具级 Agent 开始验证价值不要一开始就做多 Agent 系统选择标准团队熟悉度 生态成熟度 功能完整性 学习曲线三步选择你的 Agent 框架第一步定目标你需要什么能力简单工具调用 → 选轻量级复杂多步规划 → 选 LangGraph多 Agent 协作 → 选 CrewAI数据检索增强 → 选 LlamaIndex明确核心需求排除非必要功能。第二步看团队团队的技术栈是什么Python 为主 → LangGraph / PydanticAI.NET 生态 → Semantic Kernel需要 TypeScript → OpenAI SDK团队熟悉度比框架先进性更重要。第三步做验证用选定框架搭建 L1/L2 原型验证核心场景是否跑得通评估开发效率和可维护性小步验证不要赌全部06 企业应用架构五层架构与三层企业数字化AI 应用技术栈五层架构层级层名核心能力对应数字化目标L5Harness脚手架层编排、监控、安全企业落地入口L4Agent智能体层自主规划、多步推理企业员工数字化L3Skill技能层可复用工作流流程自动化L2MCP协议层工具标准化连接企业工具 CLI 化L1LLM大模型层理解、生成、推理基础设施下一代企业数字化架构预测系统 CLI 化 → 流程 Skill 化 → 员工 Agent 化第一层系统 CLI 化把现有系统的 GUI 操作全部 CLI 化 / API 化让 AI 能够通过程序接口操作企业系统。核心API 完备性、工具化能力第二层流程 Skill 化将企业业务流程封装为可复用的 Skill标准输入输出、可编排、跨系统流程自动化。核心流程抽象能力第三层员工 Agent 化员工 Agent 超级个体Agent 处理重复性工作员工聚焦决策和创新。人均产出提升 10-100 倍核心人机协作模式07 落地路径与创业机会垂直领域 Agent 的黄金窗口Vertical Agent最好的创业机会专业服务领域法律文档审查、合同起草与审查税务合规咨询审计辅助分析行业运营医疗影像辅助诊断金融风控建模供应链优化调度智能制造质检工业/专业领域设备预测性维护工艺流程优化质量检测自动化资源调度优化为什么垂直领域是最佳机会通用 Agent 市场已被巨头占据OpenAI、Google、Microsoft垂直领域的壁垒在于行业知识而非技术能力企业更愿意为懂行的解决方案付费从一个小而深的场景切入建立口碑后再扩展如果你不是模型你就是脚手架 —— 而垂直 Agent 是最好的脚手架七个关键要点Agent LLM 工具 记忆 规划—— LLM 只是大脑不是全部RAG 解决知识不足Agent 解决行动不足—— 两者结合效果最佳Function Calling 是 Agent 的最小可行单元MCP 是工具连接的标准协议生产级 Agent 需要 12 个核心组件Harness不是写几行提示词就够了框架选择三步骤定目标 → 看团队 → 做验证团队熟悉度比先进性重要企业数字化三阶段系统 CLI 化 → 流程 Skill 化 → 员工 Agent 化垂直领域 Agent 是当前最佳创业机会—— 壁垒在行业知识而非技术如果你不是模型你就是脚手架。—— Vivek Trivedy (Anthropic)Agent 不是魔法是工程。最好的 Agent 开发者是那些能把复杂系统拆解成可靠组件的人。