收藏 | 程序员必看:如何用 Agent 技能让 AI 按工程流程交付?

📅 2026/6/26 6:59:18
收藏 | 程序员必看:如何用 Agent 技能让 AI 按工程流程交付?
文章指出单纯依靠编写更长的提示词来指导 AI 编程存在上限因为 AI 缺乏稳定执行工程原则的能力。文章提出将工程流程拆解为可触发、可执行、可自查、可留下证据的工作规则并通过addyosmani/agent-skills项目进行实践。该项目将软件开发流程拆分为 DEFINE、PLAN、BUILD、VERIFY、REVIEW、SHIP 六个阶段每个阶段包含具体的技能和规则旨在解决 AI 编程中任务流程缺失的问题。通过将工程纪律转化为 Agent 能稳定读取的流程可以约束 AI 按照既定步骤执行任务从而提高编程质量和效率。文章建议从最痛的环节开始逐步引入 Agent Skills并与现有的项目级规则文件配合使用。很多人用 Claude Code、Codex 或 Cursor一开始都会做同一件事给 AI 写一段更长、更细、更严厉的提示词。这件事当然有用但只靠它很快会遇到上限。你会发现AI 并不是不知道“要写高质量代码”也不是不知道“测试很重要”真正的问题在于它经常没有把这些原则稳定地执行完需求还没问清楚就开始改代码测试还没跑就汇报完成遇到报错先猜一个方向改动范围一大就顺手碰到本来不该动的边界。所以我现在越来越觉得AI 编程的下一阶段不是把 prompt 写成一份更长的入职手册而是把工程流程拆成 Agent 能触发、能执行、能自查、能留下证据的工作规则。addyosmani/agent-skills这个项目值得看的地方就在这里。它不是一个“神奇提示词合集”而是把资深工程师每天都在做的规格定义、任务拆解、小步实现、测试验证、代码评审和发布准备整理成一组可以被 AI Agent 读取的 Markdown 技能。如果只用一句话概括Agent Skills 解决的不是“让 AI 更听话”而是“让 AI 按工程流程交付”。真正的问题不是提示词不够长普通 prompt 更像建议。你可以告诉 Agent请写高质量代码注意安全记得测试。这句话没有错但在真实项目里它很容易变成一句口号。模型知道这些词重要却不一定会在正确的时机停下来做正确的动作它可能会在实现前不澄清边界在实现后不跑验证在测试失败时绕开问题在汇报时只给一个看起来很完整的总结。Skill 的思路不一样。一个SKILL.md不只是告诉 Agent “你应该重视什么”而是进一步写清楚什么时候要触发这个流程应该按什么顺序推进哪些偷懒理由不能成立完成时必须拿出哪些验证证据。这点很关键。AI Agent 的很多失败并不是“不会写代码”而是“不会坚持工程纪律”。比如你让它做一个用户数据导出功能如果没有流程约束它很可能直接找接口、补 UI、拼导出逻辑看起来推进很快但权限边界、分页策略、数据量限制、审计日志、错误恢复和测试覆盖都可能被自然跳过。如果按 Agent Skills 的方式处理同一个需求会先变成一条更像工程任务的链路先写规格 - 拆小任务 - 小步实现 - 补测试 - 跑验证 - 做 review - 准备发布慢的是开头几分钟省下来的是后面几个小时的返工。prompt 解决的是“你希望 AI 怎么做”Skill 解决的是“AI 到底会不会按流程把事情做完”。这两者不是同一层能力。这个项目的核心是把开发流程拆成可触发动作agent-skills的结构很直接它把软件开发拆成 6 个阶段DEFINE - PLAN - BUILD - VERIFY - REVIEW - SHIP对应到 Claude Code 里就是 7 个 slash commands命令作用核心原则/spec定义要做什么先规格后代码/plan拆成可执行任务任务要小、可验收/build小步实现一次只做一个切片/test用测试证明测试是证据/review合并前评审先过质量门/code-simplify简化代码清晰优于聪明/ship准备发布发布要可回滚底层还有 20 个工程技能覆盖从需求到发布的完整周期。比如spec-driven-development负责先写清楚需求、边界和验收标准planning-and-task-breakdown负责把大任务拆成可检查的小任务incremental-implementation要求每个改动都保持可构建、可测试、可回滚debugging-and-error-recovery强调先复现、再定位、再修复code-review-and-quality则要求从正确性、可读性、架构、安全和性能多个角度做自查。这套设计最克制的地方是它没有把所有流程塞进一个巨大 prompt。SKILL.md只是入口真正细的检查表放在references/里需要时再加载。也就是说Agent 不需要一开始背下整本工程手册而是在遇到具体任务时加载当前真正相关的那一页。这就是所谓的渐进式上下文。好的 Agent 工作流不是“给它更多上下文”而是“在正确时机给它正确上下文”。上下文越多不一定越聪明关键是它是否能改变当前这一步的行为。最值得借鉴的是它专门反“偷懒”我看这个项目时最喜欢的不是它列了多少技能而是很多技能里都会写一类东西Common Rationalizations。翻译成人话就是 Agent 常见的偷懒理由。比如“这个改动很小不用写测试。”“我先实现后面再补验证。”“看起来没问题可以结束。”“我已经读了 README不需要查官方文档。”这些话是不是很熟人类工程师也会这么想。区别在于人类工程师通常会被 code review、CI、团队规范和线上事故经验拉回来Agent 如果没有明确门禁就很容易把这些理由当成合理路径因为对模型来说最短路径经常就是最有吸引力的路径。所以 Agent Skills 把很多“不能跳过的步骤”写得很硬。test-driven-development要求先写失败测试再写实现debugging-and-error-recovery要求先复现问题、缩小范围再改代码code-review-and-quality要求从多个维度检查代码而不是只看能不能跑shipping-and-launch则要求发布前考虑回滚、监控和风险提示。这些规则本身不新老工程师都知道。真正新的地方在于它把这些工程纪律写成了 Agent 能稳定读取的流程而不是停留在“你要注意质量”这种人类友好的提醒里。Agent 真正需要的不是鼓励而是门禁。没有门禁它会自动走最短路径门禁写清楚以后它才更像一个可以被纳入工程体系的执行者。真要用先从最痛的 3 个环节开始我不建议一上来就把 20 个技能全塞给 Agent。上下文窗口不是无限资源流程太多也会稀释当前任务重点。更务实的做法是先从你项目里最容易翻车的环节开始让 Skill 去补那个缺口。如果你只是想试水我建议从这 3 个技能开始你的问题先用哪个 Skill它解决什么需求经常跑偏spec-driven-development先把目标、边界、验收标准说清楚改完没人敢信test-driven-development用测试证明行为变化完成后质量不稳code-review-and-quality让 Agent 先做结构化自查如果你的任务经常涉及多文件改动再加一个incremental-implementation。它的价值不是让 Agent 写得更快而是强制它把大改动拆成小切片每个切片都保持可构建、可测试、可回滚。在 Claude Code 里可以直接通过插件市场安装/plugin marketplace add addyosmani/agent-skills /plugin install agent-skillsaddy-agent-skills如果你用 Cursor可以把常用的SKILL.md复制到.cursor/rules/如果你用 Gemini CLI也可以通过 skills 安装命令把skills/目录装进去。其他 Agent 工具同样可以复用这套思路因为这些技能的本质就是 Markdown 文件。通用做法也很简单git clone https://github.com/addyosmani/agent-skills.git然后把你真正需要的skills/name/SKILL.md放进对应工具的规则系统里。不要一开始追求完整体系。先解决一个最痛的环节再根据真实使用中的失败案例往里补规则这比一次性装满 20 个技能更可靠。它应该和 AGENTS.md / CLAUDE.md 配合用很多团队已经在项目里写了AGENTS.md、CLAUDE.md、.cursorrules或 Copilot instructions。Agent Skills 不是替代这些文件而是补上它们最容易失效的一层任务流程。项目级规则通常回答的是这个仓库用什么技术栈测试命令是什么哪些目录不能动提交信息怎么写完成前必须跑哪些验证Skill 回答的是另一个问题需求不清时怎么澄清多文件改动怎么切片修 bug 时怎么先复现review 时从哪些维度检查发布前要拿出哪些证据一个是“本项目的规矩”一个是“做这类事的步骤”。它们应该叠在一起用。比如你的AGENTS.md可以写本项目使用 pnpm。 测试命令是 pnpm test。 不要修改 generated/ 目录。而test-driven-development技能会要求 Agent先写一个会失败的测试。 确认测试真的失败。 写最小实现让测试通过。 重构后再次运行测试。前者告诉 Agent “在这个仓库怎么做”后者告诉 Agent “这类任务应该按什么顺序做”。如果只写前者Agent 可能知道命令却不知道什么时候必须跑如果只写后者Agent 可能知道流程却猜错项目里的真实命令。可以直接拿走的落地清单如果你想把这套思路放到自己的项目里我建议不要从“整理一套完整 Skill 体系”开始而是先做一个很小的工作流改造。这张清单可以直接用1. **选一个最常翻车的任务类型需求、bug、测试、review 或发布。** 2. **给它找一个对应 Skill不要一次装太多。** 3. **在 AGENTS.md / CLAUDE.md 里写清楚本项目命令和边界。** 4. **跑一个真实小任务观察 Agent 有没有按 Skill 留下验证证据。** 5. **如果它重复犯错把纠正沉淀成一条短规则。** 6. **每隔一段时间删掉不会改变行为的规则避免长期文件变成噪音。**我会优先把它用在三类任务上。第一类是需求不清的功能开发因为这类任务如果一开始没写清楚验收标准后面越写越像猜谜。第二类是 bug 修复因为 Agent 很容易在没有稳定复现的情况下直接改代码。第三类是多文件重构因为这种任务最容易在“顺手修一下”的过程中扩大边界。相反如果只是改一个错别字、补一个明显的文案、调整一个无风险配置就没必要把完整流程拉起来。Skill 是工程门禁不是每个小动作都要经过的审批表。Skill 的价值不在于让工作看起来更正规而在于让高风险任务少走弯路。真正应该流程化的是那些一旦出错就会返工、误判或影响线上质量的环节。最后不要把 Agent 当成更快的打字员Agent Skills 不是魔法。它不能保证模型永远理解需求也不能替代工程师判断。如果项目本身没有测试、没有构建命令、没有清晰边界Skill 写得再好Agent 仍然缺少验证依据。但它提醒了一个很重要的方向AI 编程助手要进入真实工程不只是模型能力要变强工作方式也要变得可约束、可验证、可复盘。过去大家优化 AI 编程助手最常见的动作是继续写更长的提示词现在更值得做的是把团队里那些“老工程师默认知道的流程”压缩成 Agent 能执行的规则。什么时候应该停下来问问题什么时候必须写测试什么时候必须查官方文档什么时候不能继续猜什么时候应该把改动拆小。这些东西不神秘却决定了 AI Agent 能不能真正进入生产环境。不要把 Agent 当成一个更快的打字员。更好的方向是让它按你的工程流程工作。如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线科技企业深耕十二载见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包✅ 从零到一的 AI 学习路径图✅ 大模型调优实战手册附医疗/金融等大厂真实案例✅ 百度/阿里专家闭门录播课✅ 大模型当下最新行业报告✅ 真实大厂面试真题✅ 2026 最新岗位需求图谱所有资料 ⚡️ 朋友们如果有需要《AI大模型入门进阶学习资源包》下方扫码获取~① 全套AI大模型应用开发视频教程包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点② 大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。 正确的学习路线可以为你节省时间少走弯路方向不对努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通③ 大模型学习书籍文档学习AI大模型离不开书籍文档我精选了一系列大模型技术的书籍和学习文档电子版它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。④ AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。⑤ 大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。⑥ 大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。以上资料如何领取为什么大家都在学大模型最近科技巨头英特尔宣布裁员2万人传统岗位不断缩减但AI相关技术岗疯狂扩招有3-5年经验大厂薪资就能给到50K*20薪不出1年“有AI项目经验”将成为投递简历的门槛。风口之下与其像“温水煮青蛙”一样坐等被行业淘汰不如先人一步掌握AI大模型原理应用技术项目实操经验“顺风”翻盘这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。以上全套大模型资料如何领取