跳转至

Kinodynamic Motion Retargeting for Humanoid Locomotion via Multi-Contact Whole-Body Trajectory Optimization

日期: 2026-03-10
arXiv: 2603.09956
代码: 将开源
领域: 机器人 / 运动规划
关键词: motion retargeting, dynamics, multi-contact, trajectory optimization, humanoid

一句话总结

提出 KDMR(KinoDynamic Motion Retargeting)框架——将人类运动重定向形式化为多接触整体轨迹优化问题,集成地面反作用力(GRF)约束,通过运动学优化→动力学优化两阶段消除脚滑/穿地等物理不一致性,显著提升下游模仿学习的样本效率。

研究背景与动机

  1. 领域现状: 运动重定向(从人类动捕到仿人机器人)是模仿学习的关键前处理步骤。
  2. 现有痛点: (i) 纯运动学方法产生物理不合理的伪影(脚滑、地面穿透);(ii) 这些伪影会误导强化学习策略;(iii) 复杂人类接触模式(脚跟→脚趾滚动)难以在机器人上复制。
  3. 核心 idea: 显式强制刚体动力学和接触互补约束,利用 GRF 数据自动检测接触事件。

方法详解

两阶段框架

  1. 运动学阶段:

    • 线性化正向运动学为速度级问题
    • 加权最小二乘法匹配目标关节速度
    • 尊重关节限制和速度约束
  2. 动力学阶段:

    • 刚体动力学约束: 完整离散系统动力学 \(m\ddot{\mathbf{p}} = \mathbf{R}(\mathbf{q})[\sum T_i] - mg\mathbf{e}_3\)
    • 接触约束: 接触点速度和加速度均为零(零滑移条件)
    • 摩擦锥: 线性化摩擦金字塔(4-8面近似),切向力不超过摩擦力→防滑
    • 地面约束: 脚 z 位置 ≥ 0(防穿透),法向接触力 ≥ 0
    • 互补约束: 接触力×脚地距离=0(不接触时力为零)
    • 设计动机:显式物理约束从根本上保证可行性,比后处理滤波更彻底

多接触处理(GRF 驱动)

  • 做什么:从 GRF 数据自动推断接触事件序列
  • 核心思路:分析 GRF 的脚跟/脚趾分量 → 检测摆动相(GRF≈0)和站立相(GRF>阈值)→ 进一步分离 heel-strike → full-support → toe-off 子阶段 → 生成分段接触约束
  • 设计动机:人类自然行走的脚卷(heel→toe)模式包含丰富力学信息,纯运动学方法无法复制

优化目标

多目标二次规划:最小化关节轨迹与运动学参考偏差 + 接触力光滑正则 + GRF 跟踪(软约束)

实验关键数据

运动质量对比

指标 纯运动学 (GMR) KDMR (本文)
脚部浮起 明显偏差 完全消除
地面穿透 存在 零穿透
GRF 脚跟力匹配 N/A 高度一致
GRF 脚趾力匹配 N/A 高度一致

下游模仿学习效果

评估 纯运动学参考 KDMR 参考
RL 奖励收敛速度 更快
最终策略质量 基线 显著提升

关键发现

  • 动力学优化完全消除脚滑和穿地——给下游 RL 提供了干净的参考轨迹
  • GRF 跟踪精度高——脚跟着地和脚趾蹬离的力曲线均与原始人类数据匹配
  • 下游 RL 受益显著——物理一致的参考使模仿学习更快收敛(策略不需要"修正"伪影)
  • 脚卷模式的正确复制对自然步态至关重要

亮点与洞察

  • GRF 集成 提供了强大的物理锚点——将人类行走的力学特征直接传递给机器人
  • 生物力学接触检测算法无需标签,自动从力数据推断
  • 动力学约束显式处理物理可行性,而非依赖后处理

局限性 / 可改进方向

  • 假设 GRF 数据可用,限制了不具备力板场景的应用
  • 接触推理仅针对稳态行走,跑步/跳跃等运动未验证
  • 优化可能陷入局部最优

评分

  • 新颖性: ⭐⭐⭐⭐ 将 GRF 约束整合到运动重定向中
  • 实验充分度: ⭐⭐⭐⭐⭐ GRF 跟踪 + RL 下游验证
  • 写作质量: ⭐⭐⭐⭐ 公式化规范
  • 价值: ⭐⭐⭐⭐ 对仿人机器人运动学习管线有直接改进