Humanoid Robot 强化学习项目

本项目包含两个主要的强化学习框架用于训练腿式机器人和人形机器人。

项目结构

humanoid_robot/
├── legged_gym/              # 四足机器人训练框架（ETH Zurich）
├── humanoid-gym/            # 人形机器人训练框架（RobotEra & Tsinghua）
├── legged_rl_env/           # Python虚拟环境
├── docs/                    # 项目文档
│   ├── 01_学习路径/         # 学习路径和任务规划
│   ├── 02_项目配置/         # 项目配置文档
│   ├── 03_运行指南/         # 运行和部署指南
│   └── 04_理论资料/         # 理论学习资料
├── 强化学习理论系统学习/     # 理论知识体系
└── awesome-humanoid-learning/ # 相关资源收集

快速开始

运行MuJoCo仿真（推荐）

cd humanoid-gym

# 使用虚拟环境运行humanoid-gym MuJoCo仿真
/home/binghe/software_mount_point/orbbec/humanoid_robot/legged_rl_env/bin/python \
    run_sim2sim_standalone.py \
    --load_model logs/XBot_ppo/exported/policies/policy_example.pt

状态: ✅ 已验证可用，仿真稳定运行

详细说明：docs/03_运行指南/humanoid-gym_MuJoCo仿真运行指南.md

legged_gym说明

legged_gym的URDF模型与MuJoCo兼容性有限，推荐使用Isaac Gym进行训练。

详细说明：docs/03_运行指南/legged_gym_MuJoCo仿真说明.md

文档导航

学习路径（docs/01_学习路径/）

学习路径与待办任务.md - 完整的12周学习计划，包含30+个具体任务
人形机器人强化学习实战学习路线.md - 实战学习路线
人形机器人强化学习理论学习路线.md - 理论学习路线
个性化学习方法推荐.md - 根据背景定制学习方法
人形机器人转型技术路线图.md - 技术转型指南
低硬件配置强化学习解决方案.md - 硬件受限情况下的解决方案

项目配置（docs/02_项目配置/）

humanoid-gym配置文档.md - humanoid-gym项目配置说明
legged_gym配置文档.md - legged_gym项目配置说明

运行指南（docs/03_运行指南/）

humanoid-gym_MuJoCo仿真运行指南.md - humanoid-gym MuJoCo仿真详细运行指南（✅ 已验证）
legged_gym_MuJoCo仿真说明.md - legged_gym MuJoCo兼容性说明和替代方案

理论资料（docs/04_理论资料/）

人形机器人强化学习知识体系ASCII图表.md - 知识体系可视化
人形机器人公司面试准备策略.md - 面试准备指南
强化学习理论学习文件夹结构说明.md - 理论学习目录说明

理论学习体系

位于 强化学习理论系统学习/ 目录：

已创建的核心文档

README.md - 学习体系总览
02_强化学习基础/MDP马尔可夫决策过程.md - MDP理论与代码对照
03_深度强化学习/PPO算法详解.md - PPO完整讲解
03_深度强化学习/Actor-Critic算法.md - Actor-Critic架构详解
参考资料/论文列表.md - 15+篇核心论文推荐

目录结构

强化学习理论系统学习/
├── 01_数学基础/
├── 02_强化学习基础/
├── 03_深度强化学习/
├── 04_机器人学基础/
├── 05_实现技术/
└── 参考资料/

项目特点

legged_gym

来源: ETH Zurich Robotic Systems Lab
目标: 四足机器人（ANYmal, A1）复杂地形导航
技术: Isaac Gym Preview 3 + rsl_rl PPO
特色: 大规模并行仿真、地形课程学习

humanoid-gym

来源: Beijing RobotEra & Tsinghua University
目标: 人形机器人（XBot-S/L）零样本sim-to-real
技术: Isaac Gym Preview 4 + 内置PPO + Mujoco Sim2Sim
特色: 人形专用奖励、多帧观测、DWL支持

学习建议

环境要求

硬件

GPU: NVIDIA GPU（推荐RTX 3060+）
内存: 16GB+
存储: 50GB+

软件

操作系统: Linux (Ubuntu 20.04/22.04)
Python: 3.8 或 3.10
CUDA: 11.3 或 11.7
Isaac Gym: Preview 3/4
MuJoCo: 2.3.6

当前状态

✅ 已完成

MuJoCo仿真环境: MuJoCo 2.3.6配置完成，humanoid-gym仿真验证通过
独立运行脚本:
- humanoid-gym/run_sim2sim_standalone.py - ✅ 可用
- legged_gym/run_mujoco_sim.py - ⚠️ 兼容性受限
示例策略: policy_example.pt 验证通过
学习路径: 完整的12周学习计划和30+任务
理论文档: PPO算法、Actor-Critic、MDP等核心文档
项目文档: 完整的文档目录结构和索引

📊 MuJoCo仿真支持

项目	MuJoCo支持	状态	说明
humanoid-gym	✅ 完整	已验证	推荐用于MuJoCo仿真
legged_gym	⚠️ 有限	兼容性问题	推荐使用Isaac Gym

🚧 进行中

理论学习文档补充
Isaac Gym训练指南编写

📋 待完成

Isaac Gym训练环境配置
完整训练流程文档
Sim2Real部署指南

许可证

legged_gym: BSD-3-Clause
humanoid-gym: BSD-3-Clause

贡献者

本项目文档由AI助手整理，基于以下开源项目：

legged_gym (ETH Zurich)
humanoid-gym (RobotEra & Tsinghua University)

更新日志

2024-12-22:
- 项目文档结构整理
- 创建MuJoCo仿真运行指南
- 完成学习路径规划
- 创建核心理论文档

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
.cunzhi-memory		.cunzhi-memory
awesome-humanoid-learning		awesome-humanoid-learning
docs		docs
humanoid-gym		humanoid-gym
legged_gym		legged_gym
unitree_rl_gym		unitree_rl_gym
强化学习理论系统学习		强化学习理论系统学习
.gitignore		.gitignore
MathematicalFoundationsofReinforcementLearning.mmd		MathematicalFoundationsofReinforcementLearning.mmd
MathematicalFoundationsofReinforcementLearning.pdf		MathematicalFoundationsofReinforcementLearning.pdf
README.md		README.md
humanoid_mujoco_runner.py		humanoid_mujoco_runner.py
humanoid_ppo_model.zip		humanoid_ppo_model.zip
humanoid_pybullet_rl.py		humanoid_pybullet_rl.py
test_rl_env.py		test_rl_env.py

Folders and files

Latest commit

History

Repository files navigation

Humanoid Robot 强化学习项目

项目结构

快速开始

运行MuJoCo仿真（推荐）

legged_gym说明

文档导航

学习路径（docs/01_学习路径/）

项目配置（docs/02_项目配置/）

运行指南（docs/03_运行指南/）

理论资料（docs/04_理论资料/）

理论学习体系

已创建的核心文档

目录结构

项目特点

legged_gym

humanoid-gym

学习建议

推荐学习顺序

环境要求

硬件

软件

当前状态

✅ 已完成

📊 MuJoCo仿真支持

🚧 进行中

📋 待完成

相关资源

论文

在线课程

社区

许可证

贡献者

更新日志

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages