教程上新丨强化学习仿真实操:Legged Gym 框架结构及奖励函数设计思路 📅 2026/6/26 9:23:57 强化学习在腿足机器人控制中的开发门槛极高开发者过去往往要耗费大量精力去手写和调试底层算法。为了打破这一瓶颈由 ZZS 开发、基于 Isaac Gym 构建的 Legged Gym 仿真框架应运而生。Legged Gym 的核心设计理念可以概括为「化繁为简」。它在内部深度封装了 PPO 等主流强化学习算法彻底接管了复杂的网络训练细节。开发者无需再为底层代码头疼只需调用便捷的接口即可将全部精力倾注于环境搭建与最核心的「奖励函数」设计上让开发真正回归策略本身。在实际应用层面这种高度模块化的设计赋予了开发工作极大的灵活性。Legged Gym 并不是只为某单一设备服务而是提供了一套通用的多任务解决方案。无论是简单的二阶倒立摆平衡控制还是 A1、Anymal 系列四足机器狗在平地与粗糙地形下的步态生成甚至是 Cassie、PF2 等双腿机器人的高难度行走任务都能在这个框架下顺畅运行。多达七种代表性的机器人控制任务被无缝整合在同一个工作流中让跨设备的算法验证变得前所未有的轻松。可以说Legged Gym 不仅仅是一个代码工具箱它更像是一个让强化学习回归「策略设计」本身的基础设施。它极大降低了腿足机器人智能控制的入门门槛让研究人员能够更纯粹地去验证自己的控制灵感。目前OpenBayes 官网已上线「Legged Gym强化学习仿真环境教程」教程快来直观感受机器人在算法驱动下从笨拙走向灵动的全过程吧在线运行链接https://go.openbayes.com/wlTKwIsaac Lab 官方01 Demo 运行阶段1.登录 OpenBayes.com在「公共教程」页面搜索并选择「Legged Gym强化学习仿真环境教程」。2.页面跳转后点击右上角「克隆」将该教程克隆至自己的容器中。3.选择「NVIDIA GeForce RTX 4090」以及「ubuntu」镜像点击「继续执行」。新用户使用下方邀请链接注册即可获得满 ¥10 赠 ¥10 优惠券更有机会获得 ¥15 赠金小贝总专属邀请链接直接复制到浏览器打开https://go.openbayes.com/9S6Dr4.等待分配资源当状态变为「运行中」后点击「通过 WEB 访问」即可进入 VNC 工作空间。02 效果演示1.训练前需要先激活已配置好的 Conda 环境。本容器已经完成环境安装新建终端后直接执行以下命令即可。# 激活 Legged Gym 虚拟环境 source activate /input0/legged_gym_env # 设置 Python 共享库路径Isaac Gym 依赖 export LD_LIBRARY_PATH/input0/legged_gym_env/lib:$LD_LIBRARY_PATH cd /output/legged_gym2.以下依次展示七种机器人的训练命令。每个命令启动后Isaac Gym 会弹出渲染窗口可以使用 W、S、A、D 键和 Shift、Space 键来移动视角或按住鼠标右键拖动来旋转视角。注意 训练过程会持续运行直到手动停止或达到最大迭代次数。如需在 CPU上运行可在命令后添加 --sim_devicecpu 参数。1二阶倒立摆CartPole2二阶倒立摆是强化学习入门的经典环境。该环境定义在./envs/cartpole2/cartpole2.py 中观测包括各个关节角的速度和位置6 维向量奖励函数鼓励关节角速度越小、关节角越接近竖直状态。请在终端中输入下面命令python legged_gym/scripts/train.py --taskcartpole2项目示例2Anymal C 平地行走anymal_c_flatAnymal C 是由ANYbotics 开发的四足机器人是 Legged Gym 的默认训练环境。该任务训练机器狗在平地地形上行走。请在终端中输入下面命令python legged_gym/scripts/train.py --taskanymal_c_flat项目示例3Anymal C 粗糙地形行走anymal_c_rough同样是 Anymal C 四足机器人但训练环境变为混合粗糙地形包含上坡、下坡、台阶等多种地形障碍。相比于平地任务该任务难度更高需要机器人学会自适应不同地形。请在终端中输入下面命令python legged_gym/scripts/train.py --taskanymal_c_rough项目示例4Anymal B 粗糙地形行走anymal_bAnymal B 是ANYbotics 的上一代四足机器人。该任务训练 Anymal B 在粗糙地形上行走。与 Anymal C 相比Anymal B 的硬件配置和动力学参数有所不同。请在终端中输入下面命令python legged_gym/scripts/train.py --taskanymal_b项目示例5A1 四足机器狗a1A1 是由 Unitree宇树科技开发的小型四足机器人。该任务训练 A1 在仿真环境中学习运动控制策略。请在终端中输入下面命令python legged_gym/scripts/train.py --taska1项目示例6Cassie 双腿机器人cassieCassie 是由 Agility Robotics 开发的双足机器人具有复杂的腿部关节结构。该任务训练双足机器人在仿真环境中实现稳定行走是具身智能领域中双足 locomotion 的经典研究平台。请在终端中输入下面命令python legged_gym/scripts/train.py --taskcassie项目示例7PF2 双腿鸵鸟机器人pf2PF2 是一款仿鸵鸟的双足机器人具有独特的腿部结构设计。该任务训练仿鸵鸟机器人在仿真环境中实现快速奔跑和稳定运动。请在终端中输入下面命令python legged_gym/scripts/train.py --taskpf2项目示例教程链接https://go.openbayes.com/wlTKw