跳转至

Geometric Contact Flows: Contactomorphisms for Dynamics and Control

会议: ICML2025
arXiv: 2506.17868
代码: 项目主页
领域: 机器人/接触动力学
关键词: 接触几何, 接触哈密顿, 微分同胚, 动力系统学习, 不确定性量化, 黎曼测地线, 机器人交互控制

一句话总结

提出 Geometric Contact Flows (GCF),利用黎曼几何和接触几何作为归纳偏置,通过接触微分同胚(contactomorphisms)将具有稳定性/能量守恒等期望性质的潜在接触哈密顿动力学映射到目标动力学,同时利用集成不确定性驱动测地线实现鲁棒泛化和避障。

研究背景与动机

建模含力交换和耗散的复杂动力系统是机器人、流体力学等领域的核心挑战。纯黑盒方法(如 MLP)无法编码变量间物理关系,在数据稀疏区外推失败,缺乏物理可解释性。

现有物理先验方法的局限:

  • 辛几何方法(HNN 等):仅限保守系统,无法建模摩擦和能量交换
  • 扩展辛方法(DHNN 等):将阻尼作为外部扰动,破坏辛结构,无法通过几何结构保持保证性质传递
  • 微分同胚方法(EF, NCDS 等):仅限一阶系统,无法建模自交轨迹、物理交互等复杂行为

核心动机:接触几何自然地扩展辛流形(仅增加一个物理意义明确的变量 \(s\)——拉格朗日作用量),可统一描述非保守系统中的能量耗散与生成。

方法详解

整体架构

GCF 由三个关键组件构成:

  1. 潜在接触哈密顿动力学:在潜空间 \((\mathcal{N}, \eta')\) 中设计具有期望性质的动力学
  2. 接触微分同胚集成\(N\) 个 contactomorphisms 将潜空间映射到环境空间,保持接触结构
  3. 不确定性感知测地线:利用集成方差修改黎曼度量,引导轨迹远离数据稀疏区

潜在动力学设计

\((2d+1)\) 维接触流形上,接触哈密顿函数 \(H_g(\mathbf{z})\) 生成动力学流 \(\mathbf{z}(t) = \varphi_g(t)(\mathbf{z}(0))\)。能量演化由阻尼系数控制:

\[H(t) = H(0) \, e^{\int_0^t \partial H / \partial s \, d\tau}\]

论文设计三种潜在哈密顿,覆盖不同场景:

哈密顿 形式 适用场景
\(H_{g^A}\) \(\frac{1}{2}\mathbf{p}^\top\mathbf{p} + \frac{1}{2}\mathbf{q}^\top\mathbf{q}\) 周期轨道
\(H_{g^B}\) \(\frac{1}{2}\mathbf{p}^\top\mathbf{p} + \frac{1}{2}\mathbf{q}^\top\mathbf{q} + s\) 收敛到吸引子
\(H_{g^C}\) \((\frac{1}{2}\mathbf{p}^\top\mathbf{p} + \frac{1}{2}\mathbf{q}^\top\mathbf{q} + s)s^2\) 安全停止

接触微分同胚(Contactomorphism)

将潜空间坐标 \(\mathbf{z}\) 变换为环境空间坐标 \(\mathbf{x}\),保持接触形式 \(\eta\) 不变(至共形因子)。变换实现为 \(K\) 个参数化网络的复合:

\[\varphi_r(T) = \varphi_{r_{\theta_K}}(\tau) \circ \cdots \circ \varphi_{r_{\theta_1}}(\tau)\]

每个子变换由接触哈密顿向量场的流生成:

\[H_{r_{\theta_k}} = \frac{1}{2}\mathbf{p}^\top M_{\theta_k}(\mathbf{p})\mathbf{p} + V_{\theta_k}(\mathbf{q}) + F_{\theta_k}(\mathbf{q})s\]

其中 \(M_{\theta_k}, V_{\theta_k}, F_{\theta_k}\) 由随机傅里叶特征网络参数化。架构解析可逆,正反变换计算代价相当。

预测过程

给定初始点 \(\mathbf{x}_0\),预测轨迹仅需一次正向+一次反向映射:

\[\mathbf{x}(t) = \varphi_r^{-1}(T) \circ \varphi_g(t) \circ \varphi_r(T)(\mathbf{x}_0)\]

潜在动力学积分过程中无需反复调用 contactomorphism,长程预测高效。

不确定性感知泛化

\(N\) 个 contactomorphism 组成集成,在数据丰富区预测一致、数据稀疏区预测发散。通过修改黎曼度量 \(\hat{g}\),将不确定性 \(\sigma_{\mathbf{z}}\) 纳入测地线计算,转化为最优控制问题:

\[\min_{\mathbf{u}} \int_{t_0}^{t_1} \big(\sigma_{\mathbf{z}}^2(\mathbf{z}(t)) + \|\mathbf{u}(t)\|^2\big) dt, \quad \text{s.t.} \quad \dot{\mathbf{z}}(t) = Z_{H_g}(\mathbf{z}(t)) + \mathbf{u}(t)\]

进一步可加入障碍物能量项 \(E_\Upsilon\) 实现安全避障。

实验关键数据

弹簧网格动力学重建(60 维)

方法 GCF DHNN HNN EF NCDS MLP
DTWD↓ 0.50±0.19 1.24±0.62 1.49±0.74 30.9±3.3 24.9±2.6 1.71±0.56

GCF 比次优方法 DHNN 误差降低 57%

量子系统动力学重建

方法 GCF EF NCDS MLP
DTWD↓ 0.29±0.04 0.72±0.12 0.70±0.11 0.41±0.06

HNN/DHNN 因限于偶数维相空间不适用。GCF 误差降低 60%

机器人绕拉任务(Wrap-and-Pull)

方法 EF NCDS DHNN GCF Safe GCF Stable
DTWD↓ 1.79±0.04 3.37±0.12 4.25±0.68 0.62±0.22 0.61±0.25

GCF 在真实机器人交互任务中复现误差比 EF 降低约 66%。加载后 Safe 变体能在能量耗尽时自动停止,提供安全保障。

手写数据集泛化(收敛率)

数据集 EF NCDS DHNN GCF
LASA Leaf_2 0.49±0.37 0.94±0.19 0.18±0.13 0.69±0.19
DigiLeTs Elle 0.61±0.30 0.54±0.35 0.17±0.15 0.66±0.12

GCF 在二阶动力学场景(DigiLeTs)显著优于所有一阶方法,且方差最小。

亮点与洞察

  1. 接触几何作为归纳偏置:自然统一保守与非保守系统建模,仅增加一个物理变量 \(s\)(拉格朗日作用量),远优于辛流形加倍维度或外加扰动的做法
  2. 双重几何视角:将接触流解释为黎曼测地线,既能通过接触结构保证物理性质,又能通过度量修改实现泛化控制
  3. 集成 + 测地线的泛化机制:不同于简单的集成平均,而是利用不确定性修改几何度量,在几何层面引导轨迹
  4. Safe 变体的安全停止\(H_{g^C}\) 使系统在能量耗尽前自动停止,无需额外安全约束
  5. 解析可逆架构:contactomorphism 解析可逆,长程预测只需一次正反映射

局限与展望

  1. 坐标变换开销:需要将观测数据 \(\{q, \dot{q}\}\) 转换为 canonical 坐标 \(\{q, p, s\}\),拉格朗日作用量 \(s\) 不可直接观测,需通过 Maupertuis 原理与 Noether 定理对比估计
  2. 集成训练代价\(N\) 个 contactomorphism 联合训练,计算量为单模型的 \(N\)
  3. 手写数据 LASA 上未超过 EF:在简单一阶场景中 GCF 优势不明显(0.44 vs 0.43)
  4. 避障依赖障碍物先验:障碍物需显式表示为状态空间中的点集,对复杂环境适应性有限
  5. 高维扩展性:虽附录有维度扩展实验,但在超高维系统上的表现尚需更多验证

相关工作与启发

  • Euclideanizing Flows (EF):微分同胚学习先驱,但限于一阶系统
  • Neural Contractive DS (NCDS):强收缩保证但同样一阶
  • Contact Hamiltonian (Zadra 2023):直接参数化接触哈密顿函数,训练数据外不稳定
  • Maupertuis 原理:接触流 ↔ 黎曼测地线的桥梁,为几何泛化提供理论基础
  • 启发:将不确定性融入几何结构(而非后处理)的思路可推广到其他物理先验模型

评分

  • 新颖性: ⭐⭐⭐⭐⭐ — 首次将接触几何完整引入动力系统学习,理论优雅
  • 实验充分度: ⭐⭐⭐⭐ — 物理系统+手写+真实机器人覆盖全面,但 LASA 优势有限
  • 写作质量: ⭐⭐⭐⭐ — 数学严谨,图示清晰,但数学密度很高
  • 价值: ⭐⭐⭐⭐⭐ — 为非保守动力系统学习提供了新范式,机器人交互控制前景广阔

相关论文