Agent Harness 架构全面解读:模型是司机,Harness 才是车

📅 2026/6/19 3:22:26
Agent Harness 架构全面解读:模型是司机,Harness 才是车
当我们说「AI Agent」时大多数人想到的是模型本身——Claude、GPT、Gemini。但真正让 Agent 能在现实世界中工作的不是模型的智能而是包裹在模型外面的那层「Harness」执行框架。Harness 给模型提供工具、记忆、权限和执行环境就像汽车之于司机。本文从 0 到 1 拆解 Harness 工程的核心架构、20 个关键机制、实战应用和未来方向。188KECC Stars62Klearn-claude-code20核心课程125KClaude Code Stars什么是 Harness为什么它比模型更重要在 AI Agent 领域有一个被广泛误解的概念人们以为「构建 Agent」就是训练模型或者用 prompt 编排工作流。但事实上绝大多数开发者做的事情是构建 Harness——给模型提供一个可以操作的执行环境。这个概念由 shareAI-lab 的 learn-claude-code 项目62K Stars明确提出并被 ECC188K Stars等项目验证和扩展核心公式Agent 产品 模型驱动智能 Harness执行环境模型是司机Harness 是车。司机决定去哪里但没有车就哪也去不了。Harness 包含五大要素模型Model• 感知、推理、决策• 训练得来不可编码• 决定「做什么」• Claude / GPT / GeminiHarness框架• 工具 知识 权限• 工程构建持续优化• 执行「怎么做」• Claude Code / Cursor / Codex2Agent Loop一切的起点整个 Harness 架构的核心是一个极其简洁的 Agent Loop——一个 while True 循环。模型调用工具就继续循环不调用就退出。就这么简单。Python核心 Agent Loopdef agent_loop(messages): while True: response client.messages.create( modelMODEL, systemSYSTEM, messagesmessages, toolsTOOLS, ) messages.append({role: assistant, content: response.content}) if response.stop_reason ! tool_use: return # 模型说做完了退出 # 执行模型要求的工具收集结果 results [] for block in response.content: if block.type tool_use: output TOOL_HANDLERS[block.name]( **block.input) results.append({ type: tool_result, tool_use_id: block.id, content: output, }) messages.append({role: user, content: results})这段代码就是 Claude Code、Codex CLI 等所有 Agent 产品的骨架。后续所有 20 个机制都是在这个循环外面叠加的——循环本身永远不变。模型决定何时调用工具、调用哪个工具、何时停止代码只负责执行模型的指令。 INSIGHTlearn-claude-code 的核心理念是「循环属于 Agent机制属于 Harness」。你永远不应该重写循环——所有新功能工具、权限、记忆、子Agent都是围绕这个循环添加的扩展。这也是为什么标题叫「Bash is all you need」——一个工具加一个循环就是一个完整的 Agent。Harness 五层架构Harness 五层架构从循环到记忆层层解耦第 1 层Agent Loop循环引擎while True stop_reason 判断。模型说用工具就执行说完了就退出。整个 Harness 的心跳永不修改。第 2 层Tool Dispatch工具分发一个字典映射 tool_name → handler。添加新工具只需注册一个 handler循环代码不变。Claude Code 有 40 工具Bash、Read、Write、Edit、Grep、Glob、Agent、WebSearch 等。第 3 层Permission权限管控每次工具调用前权限系统进行三级判定自动放行安全操作如 Read、需要审批如 Bash 执行命令、直接拒绝如删除系统文件。先设边界再给自由。第 4 层Context Management上下文管理上下文总会填满——必须有清理策略。四级压缩工具结果预算裁剪 → 微压缩单轮摘要→ 片段压缩 → 全量自动压缩。子 Agent 隔离防止噪声泄漏。System Prompt 运行时动态拼装。第 5 层Memory Skills记忆与技能持久记忆三步走选择什么值得记→ 提取抽取结构化信息→ 整合合并同类、删除过期。Skills 按需加载不预加载复杂任务后自动创建新 Skill。20 课 Harness 工程全景learn-claude-code 将 Harness 工程拆解为 20 节渐进式课程每节只增加一个机制。我们将其分为六大阶段20 课渐进式学习路径阶段课程一句话精髓1. 让 Agent 动起来s01 Agent Loop一个循环 Bash 一个 Agents02 Tool Use添加工具只需注册一个 handlers03 Permission先设边界再给自由s04 Hooks围绕循环添加扩展点永不重写循环2. 处理复杂任务s05 TodoWrite没有计划的 Agent 会漂移s06 Subagent大任务拆小每个子任务干净上下文s08 Context Compact上下文总会填满——必须有清理方案3. 记忆与恢复s09 Memory记住重要的忘掉不重要的s10 System PromptPrompt 运行时拼装不硬编码s11 Error Recovery错误不是终点是重试的起点4. 长时任务s12 Task System大目标拆小任务有序持久化s13 Background Tasks慢操作后台跑Agent 继续思考s14 Cron Scheduler定时触发无需人工干预5. 多 Agent 协作s15 Agent Teams太大的任务就委派给队友s16 Team Protocols队友需要统一的通信规则s17 Autonomous Agents队友自己看板、自己认领任务s18 Worktree Isolation各做各的目录互不干扰6. 扩展与集成s07 Skill Loading按需加载知识不预加载s19 MCP Plugin能力不够通过 MCP 接入更多s20 Comprehensive多种机制一个循环5关键机制深度拆解Context Compaction上下文压缩四级策略toolResultBudget截断单次工具输出→microCompact单轮摘要→snipCompact多轮片段压缩→autoCompact全量自动压缩。让 Agent 可以进行无限长会话。Subagent子 Agent生成全新的 messages[]隔离上下文。子 Agent 做侧面工作搜索、分析只带回结果。主 Agent 的上下文不会被搜索噪声污染。这是「上下文即注意力」的核心原则。Hooks钩子系统在PreToolUse和PostToolUse时机注入自定义逻辑——安全扫描、日志记录、Token 统计等。不修改核心循环通过扩展点叠加功能。ECC 的 997 测试大量依赖 Hook 机制。Worktree Isolation工作树隔离每个 Agent Worker 在独立的 Git Worktree 中工作互不干扰。TaskRecord 绑定目录 ID任务与文件系统一一对应。这是多 Agent 并行的基础设施。ECCHarness 性能优化的工业级实践ECC188K Stars是目前最大的 Harness 性能优化系统由 Anthropic 黑客松获奖者 affaan-m 开发。它不是重新造一个 Agent而是在 Claude Code、Codex、Cursor 等现有 Harness上面叠加优化层。能力规模说明预置 Agent60 个覆盖代码审查、安全扫描、构建修复等场景Skills 库232 个12 个语言生态的最佳实践技能语言支持12 种TS/Python/Go/Java/Kotlin/Rust/C/PHP/Perl 等跨 Harness7 个Claude Code / Codex / Cursor / OpenCode / Gemini / Zed / Copilot安全测试1282 条AgentShield 安全规则102 条核心规则7实战Harness 如何解决真实问题理解了架构来看看这些机制如何协同解决实际开发问题场景 1跨文件大规模重构TodoWrite先列出所有要改的文件和步骤 →Subagent并行处理独立的文件修改 →Worktree Isolation确保每个子任务在独立分支工作 →Task System追踪依赖关系确保正确的合并顺序。场景 2生产环境 Bug 排查Agent Loop接收问题描述 →Tool UseBashReadGrep读日志、搜代码 →Error Recovery遇到权限问题自动尝试备选方案 →Memory记住这个 Bug 的模式下次遇到类似问题直接应用修复。场景 3自动化巡检Cron Scheduler每天凌晨触发 →Skill Loading加载安全扫描技能 →Background Tasks后台跑测试 →Hooks在 PostToolUse 时收集结果 → 异常时通过MCP发送通知。开发者快速上手指南想亲手实践 Harness 工程三条路线1从零学习learn-claude-codeclone 仓库从 s01 到 s20 跑一遍 code.py每节课 30 分钟20 节课掌握全部机制2直接应用ECCnpm i -g ecc-universal 安装即时获得 232 个 Skills 60 个 Agent 的生产级配置3构建产品Kode Agentnpm i -g shareai-lab/kode 安装一个基于 Harness 理念构建的开源编程 Agent CLIBash快速开始# 学习路线 git clone https://github.com/shareAI-lab/learn-claude-code cd learn-claude-code pip install -r requirements.txt python s01_agent_loop/code.py # 从这里开始 # 生产应用 npm i -g ecc-universal # ECC 性能优化 npm i -g shareai-lab/kode # Kode Agent CLI未来发展方向从单 Agent 到 Agent 团队s15-s18 已经铺设了多 Agent 协作的基础——邮箱通信、协议规范、自主认领、工作树隔离。下一步是更复杂的团队拓扑层级式、网状式、专家委员会式的 Agent 组织结构。跨 Harness 统一标准ECC 已经实现了跨 7 个 HarnessClaude Code/Codex/Cursor 等的统一 Skills/Agents/Rules。MCP 协议的普及正在建立工具层的互操作标准。未来的 Harness 将像容器编排一样标准化。自进化 Harness从 ECC 的 Continuous Learning从会话中自动提取模式为 Skill到 Hermes Agent 的 Curator自动修剪 Skills 库Harness 正在从「被动执行」走向「主动优化」。未来的 Harness 将能自主调整工具集、权限策略和上下文管理策略。轨迹数据飞轮Harness 执行的每个动作序列都是训练信号。learn-claude-code 明确指出「你的 Agent 在 Harness 中产生的真实部署轨迹是微调下一代 Agent 模型的原材料。」这构成了模型→Harness→轨迹→更好的模型的正反馈循环。 TAKEAWAY智能来自模型训练不来自代码编排。但一个能工作的 Agent 产品需要模型和 Harness 的结合。模型是司机Harness 是车。最好的 Agent 产品来自那些理解自己的工作是造车而不是造司机的工程师。把 Harness 造好模型自然会发挥到极致。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】