【AI Agent学习笔记】Day 1:从裸API调用到OpenClaw,重新理解Agent与LLM的本质区别

📅 2026/7/1 2:40:14
【AI Agent学习笔记】Day 1:从裸API调用到OpenClaw,重新理解Agent与LLM的本质区别
【AI Agent学习笔记】Day 1从裸API调用到OpenClaw重新理解Agent与LLM的本质区别前言今天学习了李宏毅老师的 AI Agent 原理拆解课程收获颇丰。本文记录今日核心知识点主题是搞清楚LLM API调用和AI Agent到底有什么本质区别——这也是很多刚接触Agent开发的同学容易混淆的概念。一、误区澄清Agent ≠ LLM在学习之前我一直以为像 OpenClaw 这类 Agent 跟 LLM 大模型本质上是一回事无非是套了个壳。今天才发现并非如此二者在工程实现上有本质差异。二、裸 API 调用一问一答、无状态原生调用 OpenAI / Claude / DeepSeek 的 API工作逻辑非常简单拼接一段messages上下文发出 HTTP 请求模型返回一段文本流程直接结束下一次请求完全清空状态必须手动把全部历史重新塞进去也就是说裸API本质上是**无状态stateless**的——它不会记得上一次对话所有的记忆其实都是调用方自己在应用层维护并重新传入的。三、OpenClaw远不止调API那么简单通过今天的学习理解了 OpenClaw 的完整组成OpenClaw LLM API自己填 Key 网关调度 持久记忆引擎 标准化技能系统 本地 OS 执行沙箱 全 IM 渠道适配器 多智能体编排它要解决的核心问题是让 AI 脱离纯文本输出真正操作电脑、自主完成多步骤复杂任务——这是单纯的 API 调用永远做不到的。换句话说LLM API 只是Agent系统里的大脑而真正让Agent能做事的是上面这一整套工程化的外围系统记忆怎么存取、技能怎么标准化调用、执行环境怎么隔离、多个Agent之间怎么协作调度。这也是为什么开发一个真正的Agent系统工程量远超想象中调个API这么简单。四、对照反思我自己做的故障报告 Agent学完之后回头审视自己之前做的故障报告 Agent发现它目前更像一个 Workflow而不是真正的 Agent。判断标准很简单流程是不是固定写死的。如果分析步骤是人预先编排好的固定顺序 → Workflow如果它能根据当前情况自己动态规划下一步该做什么 → 才是真正意义上的 Agent这个对比给了我一个很实用的自查标准判断一个系统是不是Agent关键不在于用没用LLM而在于流程的决策权是不是真正交给了LLM。五、第一课的几个核心概念速记李老师课上还提到几个值得深入学习的方向Context Engineering上下文工程如何设计、管理喂给模型的上下文信息Encoder / Decoder模型处理信息的编解码机制压缩 / 过滤机制当上下文过长时如何取舍、压缩、过滤信息避免超出窗口限制原来 Agent 不只是调 API背后还有这么多底层工程逻辑要学后续会逐一展开深入。六、一点关于 AI Agent 互动现象的观察最近关于 Moltbook 背后机制的讨论也看了一些个人倾向认为舆论炒作的成分更大一些——观察发现大部分 Agent 之间的推文互动并不规律而且通常只交流一次并不会像人类那样进行多轮持续对话。这点仅作为个人观察记录仅供参考欢迎讨论。写在最后作为 Python / Django 程序员目前正在转型 AI Agent 开发方向。如果你也在转型路上或者正在学习这块内容欢迎关注交流一起踩坑、一起进步标签#AIAgent#大模型#LLM#AgentDevelopment#OpenClaw#转型笔记