理论学习:什么是 Coding Agent?

📅 2026/6/17 2:51:05
理论学习:什么是 Coding Agent?
读代码 → 理解 → 做决策 → 写代码 → 看结果 → 调整 → 再来一轮这就是 Coding Agent 做的事情。而这门课就是教你从零把这样一个东西造出来。所以 Agent 到底是什么LLM是大脑负责理解和思考。没有它就没有「理解任务」的能力。循环意味着不是一次性问答就结束。做完一步看看结果再决定下一步。就像你调试代码不可能跑一次就完美总要反复几轮。环境反馈是关键中的关键。Agent 每做一步操作都能感知到结果。执行了一个命令拿到了输出读了一个文件拿到了内容跑了一个测试拿到了报错信息。这些反馈驱动着下一轮决策。自主使用工具是说 Agent 自己判断该用什么工具。是该读文件还是写文件是该搜索代码还是执行命令这些决策由 LLM 自己做不是你预先写好的 if-else 逻辑。你可能会问这四个要素缺一个行不行不行。缺了 LLM没有理解和推理能力就是一个死板的脚本。缺了循环只能做一步就停碰到意外情况就傻了。缺了反馈Agent 就像闭着眼开车不知道自己做的对不对。缺了工具Agent 就是个空想家想了一大堆但什么都做不了。四个要素缺一不可。这就是 Agent 的全部本质。没有什么魔法也不神秘。Spec 模式给 AI 一套施工图纸直接把需求丢给 AI 让它写代码效果往往不稳定。有时候写出来的东西偏离需求有时候漏掉关键细节有时候做着做着方向就歪了。一个简单有效的做法是把需求按四份文档组织起来再交给 AI​文档​​​回答什么​​​包含什么​​​spec.md​​​做什么​​​背景、目标、功能需求、非功能需求、边界明确哪些留给后续、验收标准​​​plan.md​​​怎么做​​​架构概览、组件划分、核心接口与数据结构、模块交互、技术决策​​​task.md​​​按什么顺序做​​​文件清单、有序任务列表、每个任务的步骤和验证方式​​​checklist.md​​​做对了没​​​可观测的行为检查、集成检查、端到端场景​​这四份文档的关系你可以这样理解spec 定义做什么plan定义怎么做tasks 规划按什么顺序做checklist 确认做没做完。后续每一章的提示词都会按这个结构组织。AGENT.md# MewCode我正在构建一个终端 AI 编程助手类似 Claude Code项目名叫 GusCode使用 Java实现。## 语言中文回答中文注释。## 测试开发完功能后用 tmux 做端到端测试 1. 在 tmux 中启动 MewCode 2. 输入一段真实的对话请求 3. 观察 GusCode是否正确调用工具、生成回复 4. 对照 checklist.md 逐项验收