别光看概念了,手写一个 Agent 吧——LangChain 实现与原理拆解

📅 2026/7/2 2:25:36
别光看概念了,手写一个 Agent 吧——LangChain 实现与原理拆解
一、你的大模型其实是个残疾人你肯定遇到过“今天北京天气怎么样” “抱歉我无法获取实时信息我的知识截止到……”大模型很聪明但它有个致命短板——没有手脚。它会想不会做。不能上网查资料不会调 API连 3 × 5 都算不利索是的LLM 做算术是靠背的不是算的。那怎么办给它装上手脚。这篇文章就带你干一件事给 LLM 装上两个工具让它变成一个能自己干活、自己决策的 Agent。不光写代码还拆开看它里面到底是怎么转的。读完这篇文章当别人跟你聊 Agent 的时候你脑子里浮现的不是什么高大上的概念而是一个简单的while 循环。二、Agent 到底是什么一句话Agent LLM 工具 决策循环画成图长这样图1Agent 架构示意——LLM 工具 决策循环图1Agent 架构示意——LLM 工具 决策循环三个角色的分工LLM大脑负责推理——“现在该干什么需要哪个工具传什么参数”工具手脚能被调用的 Python 函数——查天气、算数学、搜网页什么都能包决策循环指挥官一个 while 循环——“LLM 说要调工具好调完把结果塞回去继续问它下一步”跟工作流最大的区别工作流是固定剧本A→B→CAgent 是即兴发挥——它根据中间结果自己决定下一步走哪条路。什么时候用 Agent✅ 多步推理先查 A根据结果决定查 B 还是 C✅ 需要外部信息联网搜索、数据库查询、API 调用✅ 组合工具“搜索 计算 发邮件”❌ 单轮问答直接用 LLM别上 Agent 杀鸡用牛刀❌ 固定流程用普通 if/else 比 Agent 更快更可靠三、先别急着用框架——30 行代码手写一个 Agent这一章是全文最重要的部分。跳过框架直面 Agent 的本质。在引入 LangChain 之前先用纯 Python 写一个原生 Agent。30 行代码让你看到 Agent 底层就是一个while 循环。3.1 准备工作一个 LLM 两个工具from openai import OpenAI# 初始化 LLM用 DeepSeek便宜够用换成 OpenAI/通义千问只改 base_urlclient OpenAI( api_keyyour-api-key, base_urlhttps://api.deepseek.com)# 定义两个工具函数# ⚠️ 注意docstring 是给 LLM 看的使用说明书写烂了它就不会用def search_weather(city: str) - str: 查询指定城市的实时天气。当用户询问天气时使用此工具。 Args: city: 城市名称如 北京、上海 weather_db { 北京: 小雨 22°C东北风 3 级, 上海: 多云 28°C东南风 2 级, 深圳: 雷阵雨 30°C湿度 85% } return weather_db.get(city, f未找到{city}的天气信息)def calculate(expression: str) - str: 执行数学计算。当用户需要算数时使用此工具。 Args: expression: 数学表达式如 3 5 * 2、100 * (20 30) try: # eval 仅演示用生产环境请用更安全的方式 result eval(expression, {__builtins__: {}}, {}) return f计算结果: {result} except Exception as e: return f计算出错: {e}3.2 核心30 行 Agent 循环# 工具的 JSON Schema —— 告诉 LLM 每个工具叫什么、有什么参数TOOLS [ { type: function, function: { name: search_weather, description: 查询指定城市的实时天气。当用户询问天气时使用。, parameters: { type: object, properties: { city: {type: string, description: 城市名称如 北京、上海} }, required: [city] } } }, { type: function, function: { name: calculate, description: 执行数学计算。当用户需要算数时使用。, parameters: { type: object, properties: { expression: {type: string, description: 数学表达式如 35*2} }, required: [expression] } } }]# 工具分发器根据工具名找到对应函数并执行def execute_tool(name: str, args: dict) - str: tools {search_weather: search_weather, calculate: calculate} return tools[name](**args)# Agent 的核心一个 while 循环def run_agent(user_query: str, max_steps: int 10) - str: 原生 Agent —— 揭示 Agent 就是 LLM 工具 while 循环 # 系统提示告诉 LLM 它是谁、有什么工具、怎么用 system_prompt 你是一个能调用工具的智能助手。你有以下工具可用- search_weather(city)查询指定城市的实时天气- calculate(expression)执行数学计算使用规则1. 分析用户需求判断是否需要调用工具2. 如果需要调用对应工具获取信息3. 根据工具返回的结果给出最终答案4. 如果不需要工具直接回答用户问题 # messages 是 Agent 的记忆——每一轮对话都追加进去 messages [ {role: system, content: system_prompt}, {role: user, content: user_query} ] for step in range(max_steps): # ① 调用 LLM把所有对话历史 工具定义发给它 response client.chat.completions.create( modeldeepseek-chat, messagesmessages, toolsTOOLS ) msg response.choices[0].message messages.append(msg) # LLM 的回复也存进记忆 # ② 如果 LLM 直接回复没调工具循环结束 if not msg.tool_calls: return msg.content # ③ 执行 LLM 要求的工具调用结果追加回 messages for tool_call in msg.tool_calls: tool_name tool_call.function.name tool_args eval(tool_call.function.arguments) # JSON → dict print(f 调用工具: {tool_name}({tool_args})) result execute_tool(tool_name, tool_args) print(f 工具返回: {result}) messages.append({ role: tool, tool_call_id: tool_call.id, content: result }) return 达到最大步数限制任务未完成# ── 跑一个试试 ──if __name__ __main__: result run_agent(北京天气怎么样如果下雨提醒我带伞。) print(f\n Agent 最终回答:\n{result})3.3 跑起来看看 Agent 的思考过程用户: 北京天气怎么样如果下雨提醒我带伞。 调用工具: search_weather({city: 北京}) 工具返回: 小雨 22°C东北风 3 级 Agent 最终回答:北京现在是 小雨气温 22°C东北风 3 级。今天有雨出门记得带伞发生了什么Agent 做了两件事推理——“用户想知道天气我得调 search_weather”行动——调了工具看到结果是小雨判断需要提醒带伞这就是ReActReasoning Acting——推理和行动交替进行直到任务完成。图2ReAct 推理流程——思考→行动→观察图2ReAct 推理流程——思考→行动→观察什么时候自己手写 Agent✅ 学习原理——没有比手写一遍更好的理解方式✅ 极简场景——只有一两个工具不想引入框架依赖❌ 工具多、需要错误重试、需要流式输出——这时该上框架了四、三个核心机制——从代码里提炼原理上面 30 行代码藏了 Agent 的三个核心机制。4.1 决策循环Agent Loop本质就是这一段for step in range(max_steps): response llm.invoke(messages) # 调 LLM if not response.tool_calls: # LLM 不调工具了 return response.content # → 结束 for tc in response.tool_calls: # 否则 result execute(tc) # → 执行工具 messages.append(result) # → 结果追加到对话每次循环 一轮Thought → Action → Observation。max_steps是安全阀——防止 LLM 在一个问题上反复横跳比如工具返回格式不对LLM 反复重试同一个工具。4.2 工具调用Tool Calling关键认知LLM 不执行工具它只说要调哪个、传什么参数。真正干活的是execute_tool函数——它根据 LLM 的指令去调对应的 Python 函数。LLM 的角色更像一个指挥官它看战场形势下令炮兵轰左边但炮弹不是它打的。工具描述决定一切。LLM 完全靠description和parameters来判断什么时候调用哪个工具。你写description: Does stuff.它就乱调。你写description: 查询指定城市的实时天气当用户询问天气时使用它就能精准匹配。4.3 上下文管理Messagesmessages列表就是 Agent 的记忆messages [ {role: system, content: 你有这些工具weather, calculate...}, {role: user, content: 北京天气}, {role: assistant, tool_calls: [search_weather(北京)]}, # LLM 说我要调工具 {role: tool, content: 小雨 22°C}, # 工具返回结果 {role: assistant, content: 北京小雨 22°C带伞} # LLM 综合判断后回答]规则很简单只追加不删除不重置。LLM 每轮能看到完整的我做过什么才能做出正确的下一步决策。局限也很明显对话太长 messages 会撑爆上下文窗口。LangChain 的SummarizationMiddleware就是为这个设计的——长对话自动压缩历史。图3三大核心机制——循环、工具调用、上下文图3三大核心机制——循环、工具调用、上下文五、用 LangChain 重写——感受框架帮你干了什么手写版 30 行。现在用 LangChain 的create_agent重写看看框架帮你省掉了什么。5.1 三行代码搞定from langchain.agents import create_agentfrom langchain.tools import toolfrom langchain_openai import ChatOpenAI# 定义工具 —— tool 装饰器自动把函数转成 LangChain Tooltooldef search_weather(city: str) - str: 查询指定城市的实时天气。当用户询问天气时使用。 weather_db {北京: 小雨 22°C, 上海: 多云 28°C, 深圳: 雷阵雨 30°C} return weather_db.get(city, f未找到{city}的天气)tooldef calculate(expression: str) - str: 执行数学计算。当用户需要算数时使用。 result eval(expression, {__builtins__: {}}, {}) return f计算结果: {result}# 一行建 Agentagent create_agent( modelChatOpenAI(modeldeepseek-chat, temperature0), tools[search_weather, calculate], system_prompt你是一个有用的助手帮用户查天气、算数学。)# 调用result agent.invoke({ messages: [{role: user, content: 北京天气怎么样如果下雨提醒我带伞}]})print(result[messages][-1].content)5.2 LangChain 帮你干了什么对着第三章的手写版看看哪些脏活不用自己干了手写版你要做的LangChain 自动处理手动写 JSON Schema 描述工具tool装饰器自动提取函数签名和 docstring 生成 schema手动写 while 循环内置 Agent Loop底层是 LangGraph 图引擎手动解析tool_calls并 dispatch自动解析、分发、执行手动构造{role: tool, ...}消息自动追加ToolMessage到 messages手动管理max_steps防死循环max_iterations参数默认 25无错误处理ModelRetryMiddlewareToolRetryMiddleware自动重试看不到内部过程agent.stream(stream_modeupdates)一行看每一步说白了LangChain 没有发明什么新技术——它只是把 while 循环、工具分发、消息管理这些脏活累活帮你封装了。核心机制完全一样。什么时候用 LangChain Agent✅ 快速原型——不想从零搭循环和错误处理✅ 工具较多——手动 dispatch 太麻烦✅ 需要中间件——PII 检测、上下文压缩、人工审批节点❌ 学习原理阶段——先用原生手写搞懂本质六、create_agent 底层长什么样如果你好奇create_agent一行代码背后到底发生了什么这一节给你拆开看。6.1 底层是 LangGraph 的状态图create_agent不是一个黑盒。它底层构建了一个 LangGraph 有向图图4LangGraph 状态图——create_agent 底层架构图4LangGraph 状态图——create_agent 底层架构两个核心节点model 节点把 messages含工具结果发给 LLM等它回复tools 节点解析 LLM 的tool_calls执行对应的 Python 函数结果追加回 messages一条条件边router检查 LLM 回复里有没有tool_calls。有 → 跳到 tools 节点没有 → 结束返回最终答案。6.2 旧版 vs 新版如果你看过一些老教程可能会见到AgentExecutorcreate_tool_calling_agent的写法。那是旧 API。AgentExecutor旧create_agent新循环方式Pythonwhile循环LangGraph 图节点跳转状态管理agent_scratchpad变量拼进 promptAgentStateTypedDict显式管理流式输出困难需要 hack原生stream()支持可扩展性有限中间件系统10 内置中间件建议❌ 新项目别用了✅ 唯一推荐方式如果你现在开始学 Agent直接上create_agent别在旧 API 上浪费时间。七、别踩这些坑附学习路线三个最常见的坑1. 工具描述写太烂LLM 全靠 docstring 判断什么时候调用哪个工具。你写Does stuff.它永远不知道什么时候调。正确的写法# ❌ 模糊tooldef f(x: str) - str: Do something. ...# ✅ 清晰名称 用途 参数说明tooldef search_web(query: str) - str: 搜索互联网获取最新信息。 当需要实时数据或 LLM 训练数据中不包含的信息时使用。 Args: query: 2-10 个词的搜索关键词 ...2. 忘设 max_iterationsAgent 有时会在同一个工具上反复调用比如结果格式不对LLM 以为没调成功。不设上限它就一直循环。create_agent默认 25 步大多数场景够用复杂任务可以调大但一定设个值。3. 工具返回太多数据工具一次返回 5000 行的 JSONmessages 瞬间暴涨。超出上下文窗口后 LLM 会失忆——前面的关键信息被截断了。解决办法工具内部做摘要或使用SummarizationMiddleware。推荐学习路线手写原生 Agent30 行 ← 搞懂本质while 循环 tool calling ↓用 create_agent 重写 ← 体会框架帮你省了什么 ↓加更多工具 看 stream 输出 ← 理解每一步在发生什么 ↓读 langgraph/prebuilt/tool_node.py ← 想深入就去看源码总结Agent 不神秘。用三句话讲清楚**给 LLM 一份工具清单**System Prompt 里列出所有工具及用法LLM 决定调哪个工具、传什么参数Agent 负责真正执行工具结果塞回对话LLM 看着结果继续推理——直到它觉得搞定了create_agent帮你把这个循环跑起来了。但底层原理就是你在第三章手写的那 30 行代码。搞懂这个AutoGen、CrewAI、Dify 这些框架都是同一套底层逻辑的不同封装。万变不离其宗。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】