Capsule开发指南:创建自定义智能体应用的终极教程

📅 2026/6/27 20:03:59
Capsule开发指南:创建自定义智能体应用的终极教程
Capsule开发指南创建自定义智能体应用的终极教程【免费下载链接】capsuleCapsule is an openEuler-governed infrastructure platform for agent runtimes, providing a unified and sandboxed foundation for integrating memory, models, and tools. It enables the development and secure execution of agent applications and Agent Skills, with a clear path toward agent orchestration, policy control, and multi-end interaction.项目地址: https://gitcode.com/openeuler/capsule前往项目官网免费下载https://ar.openeuler.org/ar/想要构建自己的AI智能体应用吗openEuler社区推出的Capsule项目为你提供了一个统一的智能体运行时基础设施平台Capsule是一个完全由openEuler社区控制的面向智能体运行时的基础设施项目它构建了统一的智能体运行时底座对记忆、模型与工具相关的关键环节进行抽象和约束使相关能力能够在受控的沙箱环境中以一致的方式被接入、组合与扩展。在本指南中我将为你展示如何利用Capsule平台快速创建自定义智能体应用。 Capsule项目概述Capsule是一个开源的基础设施平台旨在为智能体应用提供统一的运行时环境。它支持Agent Skills的安全执行并为后续的多智能体任务编排、安全策略控制与多端交互提供清晰的演进路径。当前仓库提供了application/slidea作为基于Capsule理念打造的示例智能体应用。 快速开始安装智能体技能Capsule提供了两个可以直接安装的智能体技能SlideaPPT生成和Deep Research深度研究。如果你的智能体平台支持本地技能可以安装其中一个或两个都安装。Slidea技能安装Slidea是一个AI驱动的PPT生成技能。要安装Slidea技能只需向你的智能体发送以下指令请从以下地址获取并遵循Slidea技能的安装说明https://raw.gitcode.com/openeuler/capsule/raw/master/application/slidea/skill/slidea/INSTALL.md安装完成后配置.env文件。最少需要配置DEFAULT_LLM。如果你想要启用PREMIUM模式保持PREMIUM_LLM_MODELgoogle/gemini-3.1-pro-preview和PREMIUM_LLM_API_BASE_URLhttps://openrouter.ai/api/v1不变通常只需要填写PREMIUM_LLM_API_KEY。使用Slidea技能在OpenClaw这样的环境中你可以这样调用使用slidea技能创建一个关于AI Agent的PPT大约10页面向产品、工程和业务领导者无需深度研究在支持斜杠命令风格的环境中你可以这样调用/slidea 创建一个关于AI Agent的PPT大约10页面向产品、工程和业务领导者无需深度研究 从源码使用Capsule如果你想为Capsule本身做出贡献或者需要在本地调试仓库可以直接从源码使用。环境配置步骤克隆仓库并进入目录git clone https://gitcode.com/openeuler/capsule.git cd capsule/application/slidea自动创建虚拟环境并安装依赖python3 scripts/install/install.py配置环境变量 如果脚本没有自动创建.env运行cp .env.example .env然后在.env中至少配置这些值SLIDEA_MODEDEFAULT_LLM_MODELDEFAULT_LLM_API_KEYDEFAULT_LLM_API_BASE_URL快速示例运行.venv/bin/python scripts/run_ppt_pipeline.py \ --text 创建一个10页的PPT介绍AI Agent无需深度研究面向工程师并涵盖Agent技术趋势️ Capsule架构解析Capsule的核心架构设计让智能体应用开发变得简单高效。让我们深入了解其核心子系统PPT生成器core/ppt_generator/负责面向演示的生成。它将源材料转换为演示文稿的写作方向幻灯片大纲每页的SVG渲染最终的原生可编辑PPTX文件这个子系统将如何思考演示文稿与如何渲染演示文稿分开。深度研究系统core/deep_research/负责递归研究和长篇综合。它不渲染幻灯片而是将广泛的请求扩展为结构化的研究过程包括问题分解、证据收集、差距审查和研究输出这些输出可以被演示文稿管道消费。当你需要在幻灯片规划之前生成见解时使用这个子系统。 项目结构详解了解Capsule的项目结构有助于更好地进行开发scripts/面向用户的CLI入口点包括技能导出、完整管道、分阶段执行、补丁渲染和嵌套安装助手skill/导出的技能包定义目录包括skill/slidea/Slidea PPT生成技能和skill/deep_research/深度研究技能core/主要的LangGraph应用程序包括深度研究、PPT生成和共享核心工具docs/面向公众的文档包括快速入门、CLI、架构和应用文档tests/可移植性、CLI合约和运行时行为的回归测试️ CLI工具使用指南Capsule主要暴露四个脚本入口点scripts/install/install.py为源码使用或导出的技能包初始化本地运行时依赖项scripts/export_skill.py从源码树导出技能包scripts/run_ppt_pipeline.py主要的生成管道支持分阶段执行scripts/patch_render_missing.py选择性重新渲染缺失或指定的页面详细使用示例.venv/bin/python scripts/run_ppt_pipeline.py \ --text 创建一个10页的PPT介绍AI Agent无需深度研究 \ --session-id session_test \ --run-id id_test恢复中断的运行PPT生成可能在执行期间暂停以与用户交互。Slidea CLI支持恢复中断的PPT生成任务。例如当scripts/run_ppt_pipeline.py返回stage: input_required时表示需要额外的用户输入。在这种情况下使用相同的run_id、session_id和--resume再次调用CLI.venv/bin/python scripts/run_ppt_pipeline.py \ --resume 面向工程师并涵盖Agent技术趋势 \ --session-id session_test \ --run-id id_test 输出与缓存机制每个PPT生成运行都由一个run_id标识。output/run_id/是Slidea技能安装目录中的运行缓存和元数据目录。运行期间生成的所有中间输出都缓存在那里。典型的缓存文件包括run.jsonreferences/research/thought/thought.mdoutline/outline.jsonppt.json最终渲染的工件被写入ppt.json中记录的渲染目录。SVG渲染路由生成svg_output/*.svg原始LLM输出、svg_final/*.svg嵌入图像后最终确定和原生可编辑的*.pptx。这种分离让系统可以重新进入一个阶段或执行补丁渲染而无需重新运行整个管道。 运行时降级行为运行时是配置驱动的。当可选服务不可用时系统会优雅降级而不是整体失败没有Tavily配置跳过网络搜索嵌入禁用或未配置跳过基于嵌入的排名没有VLM配置跳过基于VLM的图像评分和分发功能 支持的平台平台架构支持情况Linuxx86_64 / ARM64openEuler支持Linuxx86_64Ubuntu/Debian支持Windowsx86_64 / ARM64✅macOSApple Silicon✅ 推荐模型配置为了获得最佳效果建议使用以下模型配置DEFAULT_LLM_MODELgoogle/gemini-3.1-pro-preview、GLM-5.2或deepseek-v4-proPREMIUM_LLM_MODELgoogle/gemini-3.1-pro-preview或GLM-5.2默认为geminiDEFAULT_VLM_MODELkimi-2.5或kimi-2.6 高级功能HTML渲染路由Capsule还保留了一个可选的HTML渲染路由适用于需要HTML/CSS表现力和HTML→PDF→PPTX转换流程的用户。它是选择加入的需要额外的系统依赖。何时使用HTML路由仅当以下情况之一成立时选择HTML路由你特别需要HTML/CSS视觉模型例如SVG无法表达的奇特CSS布局你想要PDF中间工件以及PPTX你正在调试旧版管道对于所有其他用例请首选默认的SVG路由——它生成可编辑的原生PPTX无需Playwright或LibreOffice依赖。安装额外依赖最简单的方法——让安装程序处理python3 scripts/install/install.py --with-html-route使用HTML路由运行管道.venv/bin/python scripts/run_ppt_pipeline.py \ --text 请求 \ --render-mode html 内置模板系统Slidea内置了7个模板通用浅色、通用深色、政治红色、学术蓝色、可爱彩色、中国艺术和英文艺术。虽然Slidea通常根据主题自动选择最佳模板但用户可以在生成请求中手动指定样式。 文档资源根据你的目标从这里开始文档索引快速入门CLI参考架构概述应用概述深度研究应用PPT生成器应用 验证与测试要对文档化的可移植性和运行时行为进行轻量级回归检查运行./.venv/bin/python -m unittest tests.test_preflight tests.test_runtime_options tests.test_portability_polish 贡献指南在以下领域的贡献最有价值CLI合约和运行时稳定性研究图质量大纲或渲染质量可移植性和环境处理面向公众的文档如果你改变了行为请在同一个更改中更新docs/下的相应文档。 开始你的Capsule开发之旅Capsule为智能体应用开发提供了一个强大而灵活的平台。无论是构建PPT生成工具、研究助手还是其他类型的智能体应用Capsule都能为你提供所需的基础设施支持。通过本指南你已经了解了如何开始使用Capsule、配置环境、使用现有技能以及从源码进行开发。现在就开始你的智能体应用开发之旅吧利用Capsule的强大功能构建出令人惊叹的AI智能体应用。记住开源社区的强大力量在于协作与分享欢迎你为Capsule项目做出贡献共同推动智能体技术的发展【免费下载链接】capsuleCapsule is an openEuler-governed infrastructure platform for agent runtimes, providing a unified and sandboxed foundation for integrating memory, models, and tools. It enables the development and secure execution of agent applications and Agent Skills, with a clear path toward agent orchestration, policy control, and multi-end interaction.项目地址: https://gitcode.com/openeuler/capsule创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考