Agent工厂与A2A网络——AgentMesh设计思路

📅 2026/6/28 2:47:00
Agent工厂与A2A网络——AgentMesh设计思路
解决什么问题当前市面上的Agent产品分三类各有明确的局限。单体Agent工具Claude Code、OpenCode、Cursor解决一个人用一个Agent干活的问题。但企业场景需要多个Agent协作这类工具没有标准方式让Agent A调用Agent B。Agent协作平台Multica、Loop解决了多个Agent在一个系统里协作的问题但协作范围限定在自系统内部。Loop的Orchestrator只能调度注册在Loop里的SubagentMultica的Actor模型只能管理Multica平台内的Agent它们没有跨平台的Agent发现和协作协议。现实中企业用不同平台是常态。自主执行AgentManus给用户一个目标在云端虚拟机上自主规划执行。但它是封闭系统执行过程黑盒、单Agent架构、云端锁定、无开放协议。我们要解决的具体问题用户怎么开箱即用Agent。不是让用户自己配置Agent而是开发者用工厂平台构建好Agent用户直接用。OpenCode需要写SKILL.mdLoop需要理解20多种角色定义这是开发者工具的问题不应该让终端用户承担。本地Agent怎么调用云端能力。OpenCode跑在本地的Agent想调用企业知识库或高级模型没有标准路径。跨平台的Agent怎么互相发现和对讲。A厂商的客服Agent需要调用B厂商的库存Agent两个Agent跑在不同平台上没有通用协议。Google的A2A协议定义了通信格式但没有定义注册、认证、撮合、治理。1.2 不做的事不做基础模型。调用Claude/GPT/DeepSeek等现有模型。不替代现有工具。OpenCode和Claude Code继续用工厂负责管理和编排。1.3 竞品启示产品设计启示我们要避免的OpenCode技能按需加载不全塞上下文、权限用glob pattern、配置即文件。三个决策让Agent配置变成项目文件编辑纯本地无云编排、技能全量加载浪费上下文、配置门槛让终端用户无法直接使用Loop扁平单层协作Subagent互不调用 文件系统做共享记忆协议 停滞检测看重复错误模式而非超时强绑定TiDB、闭源、20多种角色定义过重MulticaAgent和Human用同一套数据模型多态Actor任务队列信号量控制并发重项目管理轻Agent构建ManusPlanner-Executor-Verifier三阶段 沙箱隔离 执行快照可回滚解决自主执行失控问题黑盒、封闭、云端锁定、无开放协议OpenClaw聊天应用做Agent入口Gateway Markdown文件持久化记忆透明可编辑 Pi SDK分层组合绑定聊天应用交互受限、无Agent间协作协议Hermes自改进循环任务→评估→提取技能→入库Agent越用越强。方向对但要加人工审核技能提取全自动不可控、可能积累垃圾技能Pipi.dev极简核心4工具 自我扩展Agent自己写扩展热重载。会话即树分支回溯不浪费上下文。分层monorepo每层独立可用无子Agent、无网络协作、终端限定A2A协议Agent Card和Task Lifecycle是事实标准直接在此基础上做撮合和治理只管通信格式不管注册发现、撮合、信任、仲裁跨平台Agent协作是空白地带。Google的A2A协议定义了通信格式但没有撮合和治理这是A2A网络平台的核心差异。二、Agent工厂平台Agent工厂平台是开发者构建和运行Agent的基座。开发者用工厂平台定义Agent的角色、技能、工具、记忆构建好的Agent以模板形式发布终端用户直接选用开箱即用。工厂平台同时也提供Agent的运行时环境本地、云端、混合以及开发者工具CLI、SDK、IDE插件。2.1 Agent定义模型Agent的核心数据结构采用YAML格式包含以下模块元数据ID、名称、版本、归属、标签角色定义Persona角色类型、语气、专业领域、约束条件执行模式工作流编排step-by-step或目标驱动自主autonomous记忆配置持久化策略、存储位置、保留时长技能清单引用的外部能力MCP Server、内联代码等工具清单Agent可直接调用的工具集含权限和沙箱限制模型路由默认模型、条件路由、降级策略触发器Webhook、定时任务、A2A调用运行时配置本地/云端/混合、资源配额、沙箱策略关键设计决策格式采用YAML可读性优先配置即代码。继承OpenCode的SKILL.md规范兼容现有生态。模型路由独立配置不硬编码模型选择支持按条件自动切换。运行时类型显式声明local/cloud/hybrid三种模式影响调度策略。2.2 两种执行模式2.2.1 工作流编排适用场景流程确定、需要精确控制、重复性任务。核心特征用户用可视化画布定义固定的执行路径每个节点行为确定画布是有向无环图DAG支持并行分支。与Dify的关键差异节点可嵌入自主执行子Agent混合模式执行路径完全透明可审计支持A2A协议可被外部系统调用。2.2.2 目标驱动自主适用场景目标明确但路径不确定、需要灵活决策、一次性复杂任务。核心特征用户描述目标Agent自主规划执行路径执行中可动态创建子任务、选择工具、调整策略。采用Planner-Execution-Verification架构。与Manus的关键差异维度Manus我们的实现执行环境云端虚拟机黑盒本地沙箱或云端容器透明工具集固定内置用户可配置支持MCP扩展干预能力只能暂停/重试可实时修改约束、增减工具复用性单次任务保存为可复用的Agent模板协作无支持A2A可被其他Agent调用2.2.3 模式选择场景特征推荐模式理由流程固定、重复执行工作流编排确定性高成本低易维护目标明确、路径不确定目标驱动自主灵活性强减少人工拆解跨多个系统操作混合使用工作流定义主流程自主节点处理复杂子任务模式在Agent级别声明。混合使用时工作流画布中可嵌入自主执行节点。2.3 Agent构建方式面向开发者提供四种构建途径。从模板创建浏览模板市场 → 选择模板 → 修改参数和配置 → 系统生成Agent定义 → 本地测试 → 发布到模板市场供用户使用。官方模板库Phase 1目标20个覆盖开发、数据、运营、个人四大类。从自然语言创建用自然语言描述Agent的能力和行为 → LLM解析意图 → 生成候选Agent定义YAML→ 开发者审核和调整 → 确认后可用。降低开发者从零开始写配置的成本。从现有配置导入支持OpenCode SKILL.md、Dify工作流JSON、LangChain代码、CrewAI配置、自定义YAML/JSON。导入后做兼容性检查生成报告。方便从其他平台迁移。从空白创建完整的YAML编辑器支持语法高亮、自动补全、Schema验证、版本对比。适合需要完全自定义的高级开发者。构建完成的Agent以模板形式发布到市场终端用户浏览市场选用即可无需关心Agent是怎么构建的。2.4 记忆系统Agent的记忆系统决定它能否在多次交互中保持连贯性、学习用户偏好、复用历史经验。所有记忆统一由平台在云端管理Agent不管跑在本地还是云端记忆都从云端平台读写。会话上下文管理滑动窗口、摘要压缩属于运行时引擎的技术细节不作为独立记忆层。2.4.1 工作记忆短期生命周期单个Agent实例运行期间。跨会话保持任务状态、用户偏好、中间结果。支持TTL自动清理过期数据。统一云端存储Agent实例通过平台API读写。2.4.2 长期记忆生命周期永久。跨任务学习、经验复用、知识积累。类型内容查询方式情景记忆具体任务执行记录相似度搜索语义记忆抽象规则、知识、用户画像关键词/向量混合任务完成后自动提取成功模式、错误教训、用户偏好、领域知识。检索采用混合策略工作记忆40% 情景记忆35% 语义记忆25%。同一Agent的多个实例之间工作记忆实时同步100ms长期记忆最终一致性每5分钟或任务完成后同步冲突解决用时间戳优先加关键记忆人工确认。2.5 工具接入系统所有工具无论来源统一为标准格式名称、描述、输入参数JSON Schema、输出定义、来源配置、权限控制、执行限制。来源类型说明典型场景MCPModel Context Protocol标准第三方服务HTTP任意HTTP API内部微服务Native平台内置工具文件读写、命令执行Inline用户上传的代码团队自定义逻辑工具执行在隔离环境中按隔离强度分四档无隔离只读工具、WebAssembly进程级内联代码、Docker容器级复杂环境、Firecracker微型VM不可信代码。2.6 技能系统采用扩展的SKILL.md规范定义技能包含元数据、接口定义输入/输出JSON Schema、实现代码、测试用例。类型实现方式适用场景原生技能平台内置文件读写、HTTP请求内联技能用户上传代码WebAssembly沙箱团队自定义业务逻辑复合技能多个子技能编排复杂流程封装技能市场发布流程为本地测试→提交→平台自动验证Schema检查、单元测试、安全扫描→审核上架。版本管理采用Semver主版本变更需显式升级。2.7 权限管控权限分五个层面从平台入口到跨平台调用逐层收窄。2.7.1 平台访问控制组织Organization→ 团队Team→ 用户User三层结构。角色四个角色权限范围Owner组织管理、计费、团队成员管理Admin团队管理、成员邀请、Agent发布审批Developer创建/编辑/测试Agent、管理技能Viewer查看Agent运行结果、只读访问模板市场用户可拥有多个角色权限取并集。2.7.2 Agent资源权限每个Agent有可见性控制决定谁能访问可见性谁能用谁能编辑私有仅创建者仅创建者团队团队内所有Developer及以上创建者 Admin指定成员被授权的特定用户创建者 Admin公开市场所有用户仅创建者Agent生命周期对应不同权限状态草稿创建者可编辑→ 测试中团队成员可测试→ 已发布按可见性控制→ 已下架仅创建者可操作。终端用户对市场中的Agent模板只有使用权限不能编辑原始定义。2.7.3 运行时权限Agent定义中包含权限声明运行时引擎在执行每个工具调用前检查权限。权限规则采用allow/ask/deny模式支持pattern匹配权限维度说明示例文件访问Agent能读写哪些路径read: src/**/*.ts、edit: /tmp/**命令执行Agent能执行哪些shell命令bash: git *允许、bash: rm *拒绝工具调用Agent能调用哪些MCP工具mcp__filesystem__read_file允许网络访问Agent能访问哪些域名webfetch: api.example.com/*技能加载Agent能使用哪些技能skill: internal-*拒绝匹配不到任何规则的工具调用默认deny。ask模式触发时暂停执行提示开发者或用户确认确认后可选择仅本次或本次会话内同类型全部允许。防死循环机制连续3次权限阻止后暂停并升级到人工确认累计20次阻止后停止Agent。2.7.4 数据访问控制Agent访问企业数据数据库、API、文件时不直接授予权限而是以用户身份代理访问OBOOn-Behalf-Of。用户的认证token传递给AgentAgent拿着用户token访问下游数据源数据源按用户已有的权限做行级安全RLS。Agent能访问的数据范围不超过使用它的用户本身能访问的范围。开发者构建Agent时声明需要访问哪些数据源平台在Agent运行前验证用户是否有对应数据源的访问权限无权限则拒绝启动。2.7.5 A2A跨平台权限Agent A调用Agent B时平台生成任务级临时token。token包含调用方身份、任务描述、权限范围、过期时间。Agent B拿到token后只能在这个任务范围内操作任务结束token自动失效。跨平台调用的权限在Agent Card中声明每个技能可标注所需的security schemeOAuth2 scope或mTLS要求。A2A网络平台的撮合引擎在匹配Agent时检查调用方是否满足目标Agent的security要求。2.8 运行时系统运行时系统负责Agent实例的生命周期管理、执行引擎和故障恢复。任务由谁接是A2A网络平台撮合引擎的事工厂的运行时不做任务调度。实例管理Agent被触发后启动实例。云端模式由K8s管理Pod自动扩缩容本地模式由Daemon管理进程。平台维护每个实例的健康状态、资源占用、运行时长。执行引擎工作流执行引擎按DAG拓扑排序执行支持并行分支。自主执行引擎按规划→执行→验证三阶段运行执行中发现新信息可重新规划。Agent编排平台内置编排模式库开发者选择模式而非自己实现编排逻辑。编排是确定性的系统组件不是Agent。编排模式适用场景工作方式顺序执行Sequential流程固定、步骤确定按定义顺序依次调用Agent前一步输出作为后一步输入并行执行Parallel独立子任务可同时进行同时启动多个Agent聚合结果后继续监督者模式Supervisor需要根据中间结果动态决定下一步一个监督者组件负责路由决策按规则或LLM判断将任务分发给合适的Agent群涌模式Swarm多个Agent各自处理自己擅长的部分Agent根据任务描述自行认领无中心调度规划-执行Plan-And-Execute复杂目标需要拆解先规划完整步骤再逐步执行执行中可重新规划开发者可以在工作流画布中混合使用这些模式。比如主流程用顺序执行某个复杂节点用规划-执行模式拆解多个独立子任务用并行执行。监督者模式中的路由决策默认用确定性规则关键字匹配、技能标签匹配仅在规则无法覆盖时降级为LLM判断控制成本和可预测性。任务状态任务从工厂外部到达用户直接触发或A2A网络分发RECEIVED收到→ RUNNING执行中→ COMPLETED成功/ FAILED失败/ TIMEOUT超时。重试策略默认3次指数退避区分可重试和不可重试失败。故障恢复心跳检测10秒间隔30秒超时。Agent故障自动重启最多3次。每30秒保存执行状态快照故障时从checkpoint恢复。三种运行模式本地模式Agent运行在用户机器的隔离环境中模型调用通过Daemon代理业务数据不出域。云端模式Agent运行在平台管理的K8s集群中自动扩缩容。混合模式Agent运行在本地但可调用云端技能通过Daemon与云端建立反向WebSocket。2.9 人机交互形式这里说的是用户使用Agent时的交互使用阶段有四种交互模式。2.9.1 对话式页面上就是一个对话框用户说话Agent回复。Agent的回复不只支持文字还可以返回表格、图表、文件附件、卡片。用户可以针对回复追问、纠正、补充。页面布局左侧Agent列表右侧对话区域。对话区域顶部显示Agent名称和状态底部输入框。2.9.2 流程可视化实时监控用户看到Agent正在执行的工作流当前走到哪个节点、每个节点的输入输出、哪些完成了、哪个正在执行、哪个失败了。节点颜色标记状态绿色完成、脉冲动画执行中、灰色等待、红色失败。用户可以在执行中介入暂停整个流程、重试失败节点、跳过节点、修改后续参数、手动审批需要确认的节点。页面布局上方流程执行视图可缩放拖拽下