Kinodynamic Motion Retargeting for Humanoid Locomotion via Multi-Contact Whole-Body Trajectory Optimization¶
日期: 2026-03-10
arXiv: 2603.09956
代码: 将开源
领域: 机器人 / 运动规划
关键词: motion retargeting, dynamics, multi-contact, trajectory optimization, humanoid
一句话总结¶
提出 KDMR(KinoDynamic Motion Retargeting)框架——将人类运动重定向形式化为多接触整体轨迹优化问题,集成地面反作用力(GRF)约束,通过运动学优化→动力学优化两阶段消除脚滑/穿地等物理不一致性,显著提升下游模仿学习的样本效率。
研究背景与动机¶
- 领域现状: 运动重定向(从人类动捕到仿人机器人)是模仿学习的关键前处理步骤。
- 现有痛点: (i) 纯运动学方法产生物理不合理的伪影(脚滑、地面穿透);(ii) 这些伪影会误导强化学习策略;(iii) 复杂人类接触模式(脚跟→脚趾滚动)难以在机器人上复制。
- 核心 idea: 显式强制刚体动力学和接触互补约束,利用 GRF 数据自动检测接触事件。
方法详解¶
两阶段框架¶
-
运动学阶段:
- 线性化正向运动学为速度级问题
- 加权最小二乘法匹配目标关节速度
- 尊重关节限制和速度约束
-
动力学阶段:
- 刚体动力学约束: 完整离散系统动力学 \(m\ddot{\mathbf{p}} = \mathbf{R}(\mathbf{q})[\sum T_i] - mg\mathbf{e}_3\)
- 接触约束: 接触点速度和加速度均为零(零滑移条件)
- 摩擦锥: 线性化摩擦金字塔(4-8面近似),切向力不超过摩擦力→防滑
- 地面约束: 脚 z 位置 ≥ 0(防穿透),法向接触力 ≥ 0
- 互补约束: 接触力×脚地距离=0(不接触时力为零)
- 设计动机:显式物理约束从根本上保证可行性,比后处理滤波更彻底
多接触处理(GRF 驱动)¶
- 做什么:从 GRF 数据自动推断接触事件序列
- 核心思路:分析 GRF 的脚跟/脚趾分量 → 检测摆动相(GRF≈0)和站立相(GRF>阈值)→ 进一步分离 heel-strike → full-support → toe-off 子阶段 → 生成分段接触约束
- 设计动机:人类自然行走的脚卷(heel→toe)模式包含丰富力学信息,纯运动学方法无法复制
优化目标¶
多目标二次规划:最小化关节轨迹与运动学参考偏差 + 接触力光滑正则 + GRF 跟踪(软约束)
实验关键数据¶
运动质量对比¶
| 指标 | 纯运动学 (GMR) | KDMR (本文) |
|---|---|---|
| 脚部浮起 | 明显偏差 | 完全消除 |
| 地面穿透 | 存在 | 零穿透 |
| GRF 脚跟力匹配 | N/A | 高度一致 |
| GRF 脚趾力匹配 | N/A | 高度一致 |
下游模仿学习效果¶
| 评估 | 纯运动学参考 | KDMR 参考 |
|---|---|---|
| RL 奖励收敛速度 | 慢 | 更快 |
| 最终策略质量 | 基线 | 显著提升 |
关键发现¶
- 动力学优化完全消除脚滑和穿地——给下游 RL 提供了干净的参考轨迹
- GRF 跟踪精度高——脚跟着地和脚趾蹬离的力曲线均与原始人类数据匹配
- 下游 RL 受益显著——物理一致的参考使模仿学习更快收敛(策略不需要"修正"伪影)
- 脚卷模式的正确复制对自然步态至关重要
亮点与洞察¶
- GRF 集成 提供了强大的物理锚点——将人类行走的力学特征直接传递给机器人
- 生物力学接触检测算法无需标签,自动从力数据推断
- 动力学约束显式处理物理可行性,而非依赖后处理
局限性 / 可改进方向¶
- 假设 GRF 数据可用,限制了不具备力板场景的应用
- 接触推理仅针对稳态行走,跑步/跳跃等运动未验证
- 优化可能陷入局部最优
评分¶
- 新颖性: ⭐⭐⭐⭐ 将 GRF 约束整合到运动重定向中
- 实验充分度: ⭐⭐⭐⭐⭐ GRF 跟踪 + RL 下游验证
- 写作质量: ⭐⭐⭐⭐ 公式化规范
- 价值: ⭐⭐⭐⭐ 对仿人机器人运动学习管线有直接改进