Kinodynamic Motion Retargeting for Humanoid Locomotion via Multi-Contact Whole-Body Trajectory Optimization¶

日期: 2026-03-10
arXiv: 2603.09956
代码: 将开源
领域: 机器人 / 运动规划
关键词: motion retargeting, dynamics, multi-contact, trajectory optimization, humanoid

一句话总结¶

提出 KDMR（KinoDynamic Motion Retargeting）框架——将人类运动重定向形式化为多接触整体轨迹优化问题，集成地面反作用力（GRF）约束，通过运动学优化→动力学优化两阶段消除脚滑/穿地等物理不一致性，显著提升下游模仿学习的样本效率。

领域现状: 运动重定向（从人类动捕到仿人机器人）是模仿学习的关键前处理步骤。
现有痛点: (i) 纯运动学方法产生物理不合理的伪影（脚滑、地面穿透）；(ii) 这些伪影会误导强化学习策略；(iii) 复杂人类接触模式（脚跟→脚趾滚动）难以在机器人上复制。
核心 idea: 显式强制刚体动力学和接触互补约束，利用 GRF 数据自动检测接触事件。

运动学阶段:
- 线性化正向运动学为速度级问题
- 加权最小二乘法匹配目标关节速度
- 尊重关节限制和速度约束
动力学阶段:
- 刚体动力学约束: 完整离散系统动力学 \(m\ddot{\mathbf{p}} = \mathbf{R}(\mathbf{q})[\sum T_i] - mg\mathbf{e}_3\)
- 接触约束: 接触点速度和加速度均为零（零滑移条件）
- 摩擦锥: 线性化摩擦金字塔（4-8面近似），切向力不超过摩擦力→防滑
- 地面约束: 脚 z 位置 ≥ 0（防穿透），法向接触力 ≥ 0
- 互补约束: 接触力×脚地距离=0（不接触时力为零）
- 设计动机：显式物理约束从根本上保证可行性，比后处理滤波更彻底

做什么：从 GRF 数据自动推断接触事件序列
核心思路：分析 GRF 的脚跟/脚趾分量 → 检测摆动相（GRF≈0）和站立相（GRF>阈值）→ 进一步分离 heel-strike → full-support → toe-off 子阶段 → 生成分段接触约束
设计动机：人类自然行走的脚卷（heel→toe）模式包含丰富力学信息，纯运动学方法无法复制

多目标二次规划：最小化关节轨迹与运动学参考偏差 + 接触力光滑正则 + GRF 跟踪（软约束）

评估	纯运动学参考	KDMR 参考
RL 奖励收敛速度	慢	更快
最终策略质量	基线	显著提升