每日一个开源项目(第140篇):AgentScope 2.0 - 阿里开源的生产级 Agent 框架

📅 2026/6/25 17:21:36
每日一个开源项目(第140篇):AgentScope 2.0 - 阿里开源的生产级 Agent 框架
引言“构建你能看见、能理解、能信任的 Agent。”这是每日一个开源项目系列的第140篇文章。今天的主角是AgentScope 2.0——阿里巴巴达摩院开源的生产级 Agent 框架。Agent 框架这个赛道已经很拥挤。LangChain 以链式调用为核心AutoGen 以多 Agent 对话为核心CrewAI 以角色协作为核心。AgentScope 的差异点在设计哲学上它认为当 LLM 的推理能力足够强时框架应该让路而不是用严格的流水线约束模型的行为空间。AgentScope 2.0 在这个理念上增加了生产环境所需的基础设施事件系统、权限控制、多租户隔离、沙箱执行、中间件机制。不只是能跑起来的 Demo而是能上线的系统。你将学到什么AgentScope 2.0 的设计哲学为什么选择让模型主导而非固定流水线五个核心系统Event / Permission / Multi-tenancy / Workspace / MiddlewareAgent Team 模式Leader-Worker 架构如何协调复杂任务权限系统的精细控制工具调用的审批和边界设定与 LangChain/AutoGen 的定位差异生态全貌AgentScope Runtime、ReMe、OpenJudge、Trinity-RFT前置知识了解 LLM Agent 的基本概念工具调用、推理循环有 Python 异步编程基础接触过 LangChain 或 AutoGen 更容易理解框架定位差异项目背景项目简介AgentScope 2.0 是一个生产级 Agent 框架定位是有基本抽象、配合模型能力提升、内置生产级支持的 Agent 开发平台。它解决的核心问题是传统 Agent 框架在大量场景里用严格的流水线和提示词模板约束模型但随着 LLM 推理能力的快速提升这种约束反而变成了瓶颈。AgentScope 转向让模型的原生推理和工具使用能力来主导 Agent 行为框架负责提供生产环境的基础设施而不是约束执行路径。作者/团队介绍团队: 阿里巴巴达摩院DAMO Academy核心研究者: Dawei Gao、Zitao Li、Yaliang Li、Bolin Ding、Jingren Zhou 等License: Apache-2.0版本: v2.0.22026年6月论文: arXiv:2402.140342024和 arXiv:2508.162792025项目数据⭐ GitHub Stars:27,100 Forks: 3,100 Release 数量: 40 个 License: Apache-2.0主要功能核心构建块AgentScope 2.0 的最小工作单元是Agent通过组合不同系统扩展能力importasynciofromagentscopeimportAgent,Toolkit,DashScopeChatModel,DashScopeCredentialfromagentscope.toolsimportBash,Grep,Glob,Read,Writefromagentscope.messageimportUserMsg# 定义工具集toolkitToolkit(tools[Bash(),Grep(),Glob(),Read(),Write()])# 创建 AgentagentAgent(namecode-assistant,system_prompt你是一个代码助手帮助用户分析和修改代码。,modelDashScopeChatModel(credentialDashScopeCredential(api_keyyour_key),modelqwen3.6-plus),toolkittoolkit)# 流式推理循环asyncdefrun():asyncforevtinagent.reply_stream(UserMsg(user,分析当前目录的代码结构)):matchevt.type:caseEventType.TEXT_BLOCK_DELTA:print(evt.delta,end,flushTrue)caseEventType.TOOL_CALL_START:print(f\n[工具调用]{evt.tool_name})asyncio.run(run())五个核心系统1. 事件系统Event System统一事件总线连接 Agent 推理过程的所有阶段EventType.REPLY_START# Agent 开始回复EventType.MODEL_CALL_START# 调用模型开始EventType.TEXT_BLOCK_START# 文本块开始输出EventType.TEXT_BLOCK_DELTA# 文本流式增量EventType.TEXT_BLOCK_END# 文本块结束EventType.TOOL_CALL_START# 工具调用开始EventType.TOOL_CALL_END# 工具调用完成Human-in-the-loop 工作流通过事件系统接入在特定事件上暂停 Agent等待人工确认后恢复执行。2. 权限系统Permission System细粒度控制哪些工具调用需要审批哪些可以自动执行fromagentscope.permissionimportPermissionConfig,ApprovalMode configPermissionConfig(# 文件写入需要确认Write:ApprovalMode.ALWAYS,# Bash 执行需要确认Bash:ApprovalMode.ALWAYS,# 读取可以自动执行Read:ApprovalMode.NEVER,# 单次操作超过 $0.10 需要确认default_cost_threshold0.10)Permission Bypass Mode对于测试或信任场景可以关闭所有审批Agent 完全自主运行。3. 多租户/会话隔离Multi-tenancyFastAPI 服务层提供生产级的租户和会话隔离不同租户的 Agent 实例互相不可见会话级别的上下文管理并发处理多个用户请求内置鉴权4. Workspace / 沙箱执行工具执行的隔离环境三种后端可选后端适用场景本地Local开发和测试速度最快Docker生产环境依赖隔离E2B云端沙箱最高安全性5. 中间件系统Middleware在 Agent 的推理-行动循环上插入可组合的钩子不需要修改核心 Agent 代码fromagentscope.middlewareimportLoggingMiddleware,GuardrailMiddleware agentAgent(...middlewares[LoggingMiddleware(log_tool_callsTrue),GuardrailMiddleware(blocked_patterns[rm -rf,DROP TABLE]),])Agent Team多 Agent 协作Leader-Worker 模式Leader Agent 分解任务调用内置 Team 工具创建 Worker Agent汇总结果。fromagentscope.toolsimportTeamTools# Leader Agent 有 team_tools可以创建和协调 WorkerleaderAgent(nameresearch-leader,system_prompt你是研究团队负责人负责分解任务和汇总结果,modelmodel,toolkitToolkit(tools[*TeamTools()])# 包含创建 Worker 的工具)# 运行时Leader 会自动分解任务# 分析这 5 篇论文的核心观点# → 创建 5 个 Worker每个处理一篇# → 汇总结果Worker Agent 的能力由 Leader 在运行时动态决定不需要预先定义所有可能的 Worker 类型。Task Planning任务规划Agent 把复杂任务分解为可追踪的计划步骤执行过程中实时更新任务: 给这个 Python 项目写完整的测试套件 Agent 生成计划 Step 1: [进行中] 扫描项目结构识别所有模块 Step 2: [等待] 分析每个模块的公共 API Step 3: [等待] 生成单元测试 Step 4: [等待] 生成集成测试 Step 5: [等待] 运行测试套件修复失败 Step 1 完成后 → Step 2 自动开始计划状态更新Background Task Offloading长时间运行的工具调用文件处理、网络请求、代码执行转到后台不阻塞 Agent 对话流用户: 编译这个大型 C 项目并运行测试 Agent: [发起后台任务立即继续对话] Agent: 编译任务已在后台开始预计 5 分钟。在等待期间我可以帮你做别的事情。 ...5 分钟后 系统通知: 后台任务完成 Agent: 编译完成测试结果如下...项目详细剖析设计哲学让模型主导这是 AgentScope 2.0 和很多同类框架最根本的差异传统方式LangChain 风格开发者定义固定链 Step 1 → Step 2 → Step 3开发者决定每步做什么 模型只在每步内做填空AgentScope 方式开发者提供工具集 权限 约束 模型决定做什么、按什么顺序做、用什么工具 框架负责生产环境安全、可观测性、人工接入当模型推理能力很弱时固定流水线是对的——模型需要被引导。当模型推理能力足够强时固定流水线成了约束——模型有更好的方案但执行不了。AgentScope 2.0 的时机判断是2025 年以后的主流模型已经足够强应该给它们更大的自主权。流式事件架构标准的async for evt in agent.reply_stream()使得前端可以实时显示 Agent 的思考过程工具调用可以在开始时就显示不等执行完人工审批可以插在任何工具调用前整个推理过程完全可观测和可记录生产部署AgentScope Runtime独立的 AgentScope Runtimeruntime.agentscope.io提供完整的生产服务层安全沙箱执行用于代码运行和工具调用服务化部署把 Agent 变成可调用的 API 服务多语言运行时Python、JavaJVM、TypeScript 三种后端完整生态AgentScope 不只是一个框架背后有一套完整的工具链组件功能AgentScope StudioAgent 运行的可视化调试工具ReMe跨会话持久化记忆文件 向量两种存储OpenJudge50 个评判器代码、数学、工具使用、多模态Trinity-RFTAgent 微调框架Explorer/Trainer/Buffer 解耦架构Mem0 集成长期记忆2026年6月新增与主流框架的对比维度LangChainAutoGenAgentScope 2.0核心模式链式调用多 Agent 对话模型推理主导生产设施第三方第三方内置沙箱执行无有限本地/Docker/E2B人工接入插件原生事件系统原生评测体系无无OpenJudge微调支持无无Trinity-RFT论文背书有有有2篇 arXiv项目地址与资源官方资源GitHub: agentscope-ai/agentscope官网: agentscope.io文档: docs.agentscope.io⚡Runtime: runtime.agentscope.io论文 1: arXiv:2402.140342024年论文 2: arXiv:2508.162792025年总结AgentScope 2.0 的时机感很准在 LLM 推理能力飞速提升的时间节点上选择减少框架约束让模型主导的方向。技术路线上五个核心系统Event/Permission/Workspace/Multi-tenancy/Middleware构成的基础设施层解决的是传统框架的痛点可观测性差、无法细粒度控制工具权限、不适合多用户服务化部署、代码逻辑和安全约束混在一起。生态完整度上从框架到记忆ReMe到评测OpenJudge到微调Trinity-RFT形成了一条完整的链路——这是 LangChain 和 AutoGen 没有覆盖的。27.1k Stars40 个 Release有 arXiv 论文和阿里巴巴工程团队支撑是目前生产级 Agent 框架里最值得深入研究的选项之一。探索 PrimeSkills —— 精选 AI Agent 与技能的市场每一个都经过真实企业工作流验证去掉浮夸留下真正有用的。欢迎访问我的个人主页发现更多有价值的见解和有趣的产品。