Estimation of Stochastic Optimal Transport Maps¶

会议: NeurIPS 2025
arXiv: 2512.09499
代码: 无
领域: 最优传输 / 统计学习理论
关键词: 最优传输, 随机映射, 传输误差, 鲁棒估计, Markov核

一句话总结¶

提出随机最优传输映射的新评价指标 \(\mathcal{E}_p\)（优化间隙+可行性间隙），发展了高效估计器，达到近优有限样本风险界 \(\tilde{O}(n^{-1/(d+2p)})\)，且仅需最小假设，是首个通用的（可能随机的）OT 映射估计理论。

研究背景与动机¶

领域现状：OT 映射估计理论主要基于 Brenier 定理（p=2，源分布绝对连续），保证确定性 OT 映射存在且唯一，但需要强正则性假设。
现有痛点：
Brenier 映射估计需要密度上下界、映射 Lipschitz 连续性等难以验证的假设
很多实际场景中确定性 OT 映射不存在（如单细胞发育轨迹分支），需要随机传输
现有 \(L^p\) 误差指标要求映射唯一性，不适用于随机映射
核心矛盾：现有 OT 映射估计理论覆盖范围太窄，无法处理随机 OT 映射场景。
核心idea一句话：提出传输误差 \(\mathcal{E}_p\) = 优化间隙 + 可行性间隙，无需唯一性或确定性假设。

方法详解¶

整体框架¶

定义新的传输误差 \(\mathcal{E}_p(\kappa; \mu, \nu)\)，基于它发展稳定性引理、有限样本估计器、正则性增强估计器和鲁棒估计器。

关键设计¶

传输误差 \(\mathcal{E}_p\)：
优化间隙（传输成本超出最优的部分）+ 可行性间隙（\(W_p(\kappa_\sharp\mu, \nu)\)）
当 \(\kappa\) 是最优核时 \(\mathcal{E}_p = 0\)
当确定性映射存在时，\(\mathcal{E}_p \leq 2\|T - T^\star\|_{L^p(\mu)}\)（Proposition 1）
关键优势：\(L^p\) 误差可与 \(\mathcal{E}_p\) 任意大地偏离（因为点态偏差不影响传输质量），说明 \(\mathcal{E}_p\) 更合理
稳定性引理（核心技术基础）：
Lemma 3: \(\mathcal{E}_p\) 关于 \(\nu\) 的 \(W_p\) 稳定性
Lemma 4: \(\mathcal{E}_p\) 关于 \(\mu\) 的 \(W_p\) 稳定性（需 Hölder 连续核）
这些引理是后续估计率分析的基础
近优估计器：基于熵 OT 求解器的 rounding 估计器，达到 \(\tilde{O}(n^{-1/(d+2p)})\) 收敛率，运行时间 \(O(n^{2+o_d(1)})\)
正则性增强估计器：当存在 Lipschitz 最优核 \(\kappa_\star\) 时，收敛率提升到 \(\tilde{O}(n^{-1/(d \vee 2p)})\)，与估计 \(\mu\)/\(\nu\) 本身的复杂度相同
鲁棒估计：处理 TV budget \(\varepsilon\) + \(W_p\) budget \(\rho\) 的混合对抗性污染，\(\mathcal{E}_p\) 的稳定性使得可以干净地解耦两种污染类型

与 Monge gap 的关系¶

Lemma 2 证明 \(\mathcal{E}_p \leq 4\mathcal{E}_p'\)，当 \(p=1\) 时 \(\mathcal{E}_1'/2 \leq \mathcal{E}_1 \leq 2\mathcal{E}_1'\)。\(\mathcal{E}_p\) 更适合定量统计分析，而 Monge gap 更适合神经网络实现（梯度信号更强）。

实验关键数据¶

主实验¶

数值模拟验证了 \(\mathcal{E}_p\) 指标的实际效果：在确定性 OT 映射不存在的场景中，\(\mathcal{E}_p\) 近似为 0 而 \(L^p\) 误差任意大。

关键发现¶

\(\mathcal{E}_p\) 在确定映射不存在时仍有意义，而 \(L^p\) 指标完全失效
收敛率 \(n^{-1/(d+2p)}\) 接近下界 \(n^{-1/(d \vee 2p)}\)，近优

亮点与洞察¶

第一个通用 OT 映射估计理论：覆盖确定性和随机性 OT 映射，假设最小
\(\mathcal{E}_p\) 与 Monge gap 的关系：当 p=1 时两者等价，但 \(\mathcal{E}_p\) 更适合定量分析

局限性 / 可改进方向¶

高维度时收敛率慢（维数诅咒）
神经网络估计器的理论分析未涵盖

评分¶

新颖性: ⭐⭐⭐⭐⭐ 开创性的理论贡献，填补了随机 OT 映射估计的空白
实验充分度: ⭐⭐⭐ 以理论为主，实验为辅
写作质量: ⭐⭐⭐⭐⭐ 严谨流畅
价值: ⭐⭐⭐⭐⭐ 对 OT 研究社区有深远影响