读书笔记:从 LLM 到 Agent Skill

📅 2026/7/2 6:12:18
读书笔记:从 LLM 到 Agent Skill
一、LLM大语言模型LLM是基于Transformer架构的深度学习模型核心原理是“下一个词预测”——给定上文预测最可能的下一个 token。它是整个 AI 应用生态的基石为 Prompt Engineering、Tool Calling、RAG、Agent 等上层能力提供通用的语言智能基座。二、Token 与 Context WindowToken 是 LLM 处理文本的最小单元一个 token 可以是一个词、一个子词或一个标点符号。Context Window上下文窗口是模型在一次对话中能“记住”的 token 总量上限直接决定了长文档处理、多轮对话记忆和复杂任务的承载能力。三、Prompt 工程User Prompt 是用户直接输入的指令System Prompt 是开发者预置的角色设定和行为准则。两者在模型内部拼接为整体输入System Prompt 设定规则和基调User Prompt 触发具体任务。四、Tool工具调用Tool Calling 让 LLM 从“只会说”进化为“还能做”——模型判断需求后生成结构化的函数调用请求JSON 格式外部系统执行后将结果回传模型再整合为自然语言回复从而突破纯文本能力边界。五、MCPModel Context ProtocolMCP 是 Anthropic 提出的开放标准协议旨在统一 AI 与外部工具、数据源的接口。采用 Client-Server 架构实现“一次开发处处使用”类比 USB 协议统一外设连接标准。六、Agent智能体Agent 是具备自主规划与执行能力的 AI 系统通过“感知 → 规划 → 执行 → 反馈”循环自主完成多步骤复杂任务。与传统 LLM 的一问一答不同Agent 能主动拆解任务、选择工具、根据反馈调整策略。七、Agent Skill智能体技能Agent Skill 是 Agent 的可复用能力模块封装了领域知识、工具组合和标准化工作流程。Tool 是原子操作“能做什么”Skill 是复合能力“怎么做好一件事”两者在粒度、决策能力和知识含量上有本质区别。