hello-agents学习笔记 📅 2026/7/4 20:11:11 学习笔记智能体经典范式构建一.智能体范式ReAct (Reason + Act)ReAct由Shunyu Yao于2022年提出[1],其核心思想是模仿人类解决问题的方式,将推理 (Reasoning)与行动 (Acting)显式地结合起来,形成一个“思考-行动-观察”的循环Thought (思考):这是智能体的“内心独白”。它会分析当前情况、分解任务、制定下一步计划,或者反思上一步的结果。Action (行动):这是智能体决定采取的具体动作,通常是调用一个外部工具,例如Search['华为最新款手机']。Observation (观察):这是执行Action后从外部工具返回的结果,例如搜索结果的摘要或API的返回值。智能体将不断重复这个Thought - Action - Observation的循环,将新的观察结果追加到历史记录中,形成一个不断增长的上下文,直到它在Thought中认为已经找到了最终答案,然后输出结果。这个过程形成了一个强大的协同效应:推理使得行动更具目的性,而行动则为推理提供了事实依据。1.工具三个核心要素:名称 (Name): 一个简洁、唯一的标识符,供智能体在Action中调用,例如Search。描述 (Description): 一段清晰的自然语言描述,说明这个工具的用途。这是整个机制中最关键的部分,因为大语言模型会依赖这段描述来判断何时使用哪个工具。执行逻辑 (Execution Logic): 真正执行任务的函数或方法。2.ReAct 的主要特点高可解释性:ReAct 最大的优点之一就是透明。动态规划与纠错能力:与一次性生成完整计划的范式不同,ReAct 是“走一步,看一步”。工具协同能力:ReAct 范式天然地将大语言模型的推理能力与外部工具的执行能力结合起来。3.ReAct 的固有局限性对LLM自身能力的强依赖:ReAct 流程的成功与否,高度依赖于底层 LLM 的综合能力执行效率问题:由于其循序渐进的特性,完成一个任务通常需要多次调用 LLM。提示词的脆弱性:整个机制的稳定运行建立在一个精心设计的提示词模板之上。可能陷入局部最优:步进式的决策模式意味着智能体缺乏一个全局的、长远的规划。4.调试技巧