跳转至

Estimation of Stochastic Optimal Transport Maps

会议: NeurIPS 2025
arXiv: 2512.09499
代码: 无
领域: 最优传输 / 统计学习理论
关键词: 最优传输, 随机映射, 传输误差, 鲁棒估计, Markov核

一句话总结

提出随机最优传输映射的新评价指标 \(\mathcal{E}_p\)(优化间隙+可行性间隙),发展了高效估计器,达到近优有限样本风险界 \(\tilde{O}(n^{-1/(d+2p)})\),且仅需最小假设,是首个通用的(可能随机的)OT 映射估计理论。

研究背景与动机

  1. 领域现状:OT 映射估计理论主要基于 Brenier 定理(p=2,源分布绝对连续),保证确定性 OT 映射存在且唯一,但需要强正则性假设。

  2. 现有痛点

  3. Brenier 映射估计需要密度上下界、映射 Lipschitz 连续性等难以验证的假设
  4. 很多实际场景中确定性 OT 映射不存在(如单细胞发育轨迹分支),需要随机传输
  5. 现有 \(L^p\) 误差指标要求映射唯一性,不适用于随机映射

  6. 核心矛盾:现有 OT 映射估计理论覆盖范围太窄,无法处理随机 OT 映射场景。

  7. 核心idea一句话:提出传输误差 \(\mathcal{E}_p\) = 优化间隙 + 可行性间隙,无需唯一性或确定性假设。

方法详解

整体框架

定义新的传输误差 \(\mathcal{E}_p(\kappa; \mu, \nu)\),基于它发展稳定性引理、有限样本估计器、正则性增强估计器和鲁棒估计器。

关键设计

  1. 传输误差 \(\mathcal{E}_p\)
  2. 优化间隙(传输成本超出最优的部分)+ 可行性间隙(\(W_p(\kappa_\sharp\mu, \nu)\)
  3. \(\kappa\) 是最优核时 \(\mathcal{E}_p = 0\)
  4. 当确定性映射存在时,\(\mathcal{E}_p \leq 2\|T - T^\star\|_{L^p(\mu)}\)(Proposition 1)
  5. 关键优势:\(L^p\) 误差可与 \(\mathcal{E}_p\) 任意大地偏离(因为点态偏差不影响传输质量),说明 \(\mathcal{E}_p\) 更合理

  6. 稳定性引理(核心技术基础)

  7. Lemma 3: \(\mathcal{E}_p\) 关于 \(\nu\)\(W_p\) 稳定性
  8. Lemma 4: \(\mathcal{E}_p\) 关于 \(\mu\)\(W_p\) 稳定性(需 Hölder 连续核)
  9. 这些引理是后续估计率分析的基础

  10. 近优估计器:基于熵 OT 求解器的 rounding 估计器,达到 \(\tilde{O}(n^{-1/(d+2p)})\) 收敛率,运行时间 \(O(n^{2+o_d(1)})\)

  11. 正则性增强估计器:当存在 Lipschitz 最优核 \(\kappa_\star\) 时,收敛率提升到 \(\tilde{O}(n^{-1/(d \vee 2p)})\),与估计 \(\mu\)/\(\nu\) 本身的复杂度相同

  12. 鲁棒估计:处理 TV budget \(\varepsilon\) + \(W_p\) budget \(\rho\) 的混合对抗性污染,\(\mathcal{E}_p\) 的稳定性使得可以干净地解耦两种污染类型

与 Monge gap 的关系

Lemma 2 证明 \(\mathcal{E}_p \leq 4\mathcal{E}_p'\),当 \(p=1\)\(\mathcal{E}_1'/2 \leq \mathcal{E}_1 \leq 2\mathcal{E}_1'\)\(\mathcal{E}_p\) 更适合定量统计分析,而 Monge gap 更适合神经网络实现(梯度信号更强)。

实验关键数据

主实验

数值模拟验证了 \(\mathcal{E}_p\) 指标的实际效果:在确定性 OT 映射不存在的场景中,\(\mathcal{E}_p\) 近似为 0 而 \(L^p\) 误差任意大。

关键发现

  • \(\mathcal{E}_p\) 在确定映射不存在时仍有意义,而 \(L^p\) 指标完全失效
  • 收敛率 \(n^{-1/(d+2p)}\) 接近下界 \(n^{-1/(d \vee 2p)}\),近优

亮点与洞察

  • 第一个通用 OT 映射估计理论:覆盖确定性和随机性 OT 映射,假设最小
  • \(\mathcal{E}_p\) 与 Monge gap 的关系:当 p=1 时两者等价,但 \(\mathcal{E}_p\) 更适合定量分析

局限性 / 可改进方向

  • 高维度时收敛率慢(维数诅咒)
  • 神经网络估计器的理论分析未涵盖

相关工作与启发

  • vs Brenier 映射估计:Brenier 理论需要绝对连续性+光滑性,\(\mathcal{E}_p\) 无需这些假设
  • vs Monge gap\(\mathcal{E}_p\) 更适合统计理论分析

评分

  • 新颖性: ⭐⭐⭐⭐⭐ 开创性的理论贡献,填补了随机 OT 映射估计的空白
  • 实验充分度: ⭐⭐⭐ 以理论为主,实验为辅
  • 写作质量: ⭐⭐⭐⭐⭐ 严谨流畅
  • 价值: ⭐⭐⭐⭐⭐ 对 OT 研究社区有深远影响