Potential Field Based Deep Metric Learning¶

会议: CVPR 2025
arXiv: 2405.18560
代码: 无
领域: 其他 / 度量学习
关键词: 深度度量学习, 势能场, 代理, 衰减性质, 物理启发

一句话总结¶

提出 PFML，用物理势能场概念替代传统的 tuple mining 进行度量学习——每个样本在嵌入空间中创建连续的引力场（同类）和斥力场（异类），具有距离衰减特性（远处交互力弱），在 Cars-196 上 R@1 达 92.7%（前 SOTA 89.6%）。

领域现状：深度度量学习（DML）通过学习嵌入空间使同类样本近、异类样本远。核心方法是 tuple mining——构建正负样本对/三元组来计算损失。

现有痛点：（1）Tuple mining 组合爆炸——\(N^2\) 或 \(N^3\) 的采样复杂度；（2）现有对比/三元组损失对远离样本的交互力反而更强（梯度与距离成正比），导致优化被远处离群点主导；（3）硬样本挖掘策略需要精心调参。

核心矛盾：直觉上距离远的样本不应该有强交互力（已经分得够开了），但对比损失的数学形式恰恰给远距离分配了更大梯度。

切入角度：物理势能场天然具有距离衰减性——引力和斥力都随距离增大而减弱。用势能场的数学形式替代 tuple-based 损失。

核心 idea：吸引/排斥势能场 + 距离衰减特性 = 无需 tuple mining 的度量学习。

连续势能场：吸引势 \(\psi_{att}(r, z_i) = -1/\|r-z_i\|^\alpha\)（同类），排斥势 \(\psi_{rep}(r, z_i) = 1/\|r-z_i\|^\alpha\)（异类，距离 \(<\delta\) 时有效）。总能量对所有样本和代理求和
距离衰减特性：Proposition 1 证明势能场梯度随距离 \(\alpha+1\) 次方衰减——远离的样本几乎不受力，优化集中在边界附近
M 个代理/类：每类用 M 个可学习代理表示子群，代理也参与势能场

总势能 \(\mathcal{U} = \sum_i \Psi_{y_i}(z_i) + \sum_{j,k} \Psi_j(p_{j,k})\)。Corollary 1 证明 PFML 的代理均衡比对比方法有更低的 Wasserstein 距离。

数据集	PFML	HIST (前SOTA)	提升
CUB-200 R@1	73.4%	71.8%	+1.6%
Cars-196 R@1	92.7%	89.6%	+3.1%
SOP R@1	82.9%	81.4%	+1.5%

有标签噪声时 R@1 提升 7%——衰减性质使噪声离群点影响更小。