跳转至

Harnessing Feature Resonance under Arbitrary Target Alignment for Out-of-Distribution Node Detection

会议: NeurIPS 2025
arXiv: 2502.16076
代码: ShenzhiYang2000/RSL
领域: ai_safety / graph OOD detection
关键词: OOD detection, graph neural networks, feature resonance, unsupervised, node-level, label-agnostic

一句话总结

发现 Feature Resonance 现象——优化已知 ID 节点表征时未知 ID 节点的表征变化显著大于 OOD 节点,且该现象与标签无关,据此提出无需多类标签的图 OOD 节点检测框架 RSL,在 13 个数据集上达到 SOTA。


研究背景与动机

领域现状:图上的 OOD 节点检测是保证 GNN 部署可靠性的关键任务。现有方法(MSP、Energy、KNN、NNGuide 等)主要分为两类:基于分类器输出(熵/能量分数)和基于监督表征(KNN 距离),均严重依赖预训练好的多类分类器。

现有痛点: - 标签假设过强:需要多类标签可用且前置任务是分类任务; - 场景受限:大量实际 OOD 检测场景不满足分类前提——生成模型、回归任务、强化学习、one-class 检测等均缺乏多类标签; - 图节点级别的无监督 OOD 检测研究严重不足:仅有 EnergyDef 等极少数工作,且性能仍有很大提升空间。

核心矛盾:现有方法绑定在分类器输出/标签空间上,无法扩展到无标签场景;而图节点之间的局部连接关系蕴含了丰富的分布信息,如何在不依赖标签的情况下挖掘这些信息是核心挑战。

本文切入角度:从标签空间转向特征空间,关注表征优化过程中 ID/OOD 节点的行为差异,提出完全与标签和前置任务无关的 OOD 检测方法。


核心思想

Feature Resonance(特征共振)现象

作者发现了一个关键现象:

当对已知 ID 节点的表征进行优化(即使是对齐到任意随机向量)时,未知 ID 节点的表征会发生比 OOD 节点更显著的变化。

物理类比:类似受迫振动中的共振效应——当外力频率与振荡器固有频率匹配时振幅最大。ID 节点因共享底层数据流形而产生"共振"响应,OOD 节点因属于不同流形结构而响应微弱。

核心洞察:Feature Resonance 与标签无关,源于 ID 节点表征之间的内在流形关联,因此天然适合无类别标签、任务无关的 OOD 检测场景。


方法详解

1. 宏观特征共振(Macroscopic Feature Resonance)

定义特征轨迹度量:

\[\hat{F}(\tilde{\mathbf{x}}_i) = \sum_t h_{\theta_{t+1}}(\tilde{\mathbf{x}}_i) - h_{\theta_t}(\tilde{\mathbf{x}}_i)\]

其中 \(h_{\theta_t}\) 是第 \(t\) 个 epoch 的模型。理想条件下 \(\|\hat{F}\|\) 对 ID 节点大于 OOD 节点。但在复杂真实数据上,全程轨迹受噪声(训练初期)和过拟合(训练后期)干扰,可靠性不足。

2. 微观特征共振(Microscopic Feature Resonance)

为解决宏观轨迹不稳定的问题,引入单步表征变化作为微观代理:

\[\tau_i = \|\Delta h_{\theta_t}(\tilde{\mathbf{x}}_i)\|_2 = \|h_{\theta_{t+1}}(\tilde{\mathbf{x}}_i) - h_{\theta_t}(\tilde{\mathbf{x}}_i)\|_2\]

关键发现:特征共振现象不是全程持续的,而是在训练中期最显著——早期模型搜索优化路径导致混乱,中期找到与 ID 样本模式匹配的路径后共振最强,后期过拟合导致共振消散。通过一个简单的 ID/OOD 验证集即可精确定位共振期。

3. 任意目标对齐训练

将已知 ID 节点的表征对齐到一个随机生成的目标向量 \(e\)

\[\ell(h_{\theta_t}(\mathbf{X}_{\text{known}}), e) = \mathbb{E}(\|\mathbf{1}^\top e - \mathbf{X}_{\text{known}} \mathbf{W}^\top\|_2^2)\]

关键实验验证:无论是真实多类标签、随机多类标签、还是单一随机向量作为对齐目标,未知 ID 节点的 \(\tau\) 始终大于 OOD 节点,证明了 Feature Resonance 的标签无关性。

4. 合成 OOD 节点增强(RSL 框架)

在微观共振分数基础上,整合合成 OOD 节点策略以进一步提升检测性能:

  • 候选 OOD 筛选:选取 \(\tau\) 值最小的 \(n\) 个野生节点作为候选 OOD 集 \(\mathcal{V}_{\text{cand}}\)
  • SGLD 合成:用随机梯度 Langevin 动力学基于候选 OOD 节点生成合成 OOD 节点,使合成节点更贴近真实 OOD 分布:
\[\hat{\mathbf{x}}_j^{(t+1)} = \lambda\big(\hat{\mathbf{x}}_j^{(t)} - \frac{\alpha}{2}\nabla E_\theta(\hat{v}_j^{(t)}) + \epsilon\big) + (1-\lambda)\mathbb{E}_{\mathbf{x} \sim \mathbf{X}_{\text{cand}}}(\mathbf{x} - \hat{\mathbf{x}}_j^{(t)})\]
  • OOD 分类器训练:用已知 ID(标签 1)+ 候选 OOD + 合成 OOD(标签 0)训练二分类器,损失为二元交叉熵

5. 理论保证

提供了共振分数 \(\tau\) 对 OOD 节点可分性的误差上界(Theorem 1):当已知 ID 数据量 \(n\) 和野生数据量 \(m\) 足够大、最优 ID 风险 \(R_{in}^*\) 足够小时,OOD 误筛率 \(\text{ERR}_{\text{out}}\) 有上界且可趋于零(Theorem 2)。


实验关键数据

主实验——无监督 OOD 节点检测(9 个数据集)

方法 YelpChi AUROC↑ Amazon AUROC↑ Reddit AUROC↑ 是否需要标签
EnergyDef 62.04 86.57 63.32
GRASP (伪标签) 58.05 70.31 51.82 K-means 伪标签
RSL 66.11 90.03 64.83

在 YelpChi/Amazon/Reddit 上,RSL 相比 SOTA 在 AUROC/AUPR/FPR95 上平均提升 3.01%/7.09%/8.95%。

消融实验

变体 说明 Amazon FPR95↓
RSL w/o classifier 仅用共振分数 \(\tau\) 19.56
RSL w/o \(\mathcal{V}_{\text{syn}}\) 无合成 OOD 节点 25.18
RSL(完整) 共振 + 合成 + 分类器 19.60

仅使用共振分数 \(\tau\) 已比 SOTA 的 FPR95 平均降低 9.70%,验证了 Feature Resonance 本身的有效性。

不同对齐目标的效果(WikiCS)

对齐目标 AUROC↑ AUPR↑
真实多类标签 71.03 72.47
随机多类向量 73.64 74.13
单一随机向量 79.15 78.65

单一随机向量反而效果最好——简单对齐目标足以激发共振,且避免了标签噪声的干扰。

异质图上的优势

在异质图(Squirrel、WikiCS、Chameleon)上,RSL 的 FPR95 比 SOTA 平均降低 14.93%,因为 RSL 不依赖图同质性假设。


亮点与洞察

  • Feature Resonance 现象本身是核心贡献:揭示了训练过程中 ID/OOD 节点表征动态的根本差异,提供了全新的 OOD 检测视角。这一发现可能不限于图领域,在其他模态同样值得探索。
  • 标签无关性的优雅:对齐到任意随机向量即可诱发共振效应,彻底摆脱了对前置分类任务和多类标签的依赖。
  • 共振期的自动定位:通过简单的 ID/OOD 验证集在训练过程中定位微观共振最显著的 epoch,实用性强。
  • 合成 OOD 节点与共振的协同:用共振分数筛选候选 OOD 节点引导 SGLD 生成,使合成节点更贴近真实 OOD 分布,优于 EnergyDef 的无引导生成。

局限与展望

  • 验证集假设:虽然不需要多类标签,但仍需要一个含 ID/OOD 二元标注的验证集来定位共振期,这在某些场景下可能不易获取。
  • 计算开销:需要完整训练过程并在每个 epoch 计算所有节点的表征变化,对大规模图可能有效率瓶颈。
  • 共振期的稳定性:共振期的位置可能因数据集、模型结构和超参数而异,自动化定位的鲁棒性有待进一步验证。
  • 改进方向
    • 探索在图像/文本等非图数据上的 Feature Resonance 现象
    • 研究无需验证集的共振期自动定位方法
    • 将共振分数与其他自监督方法结合

相关工作对比

  • vs EnergyDef (Gong & Sun, 2024):同为无监督图 OOD 检测,但 EnergyDef 的合成 OOD 节点无引导,RSL 用共振分数筛选候选 OOD 引导生成,性能全面超越。
  • vs GRASP (Ma et al., 2024):GRASP 是当前有监督 SOTA,使用 K-means 伪标签时性能大幅下降;RSL 不用任何标签即超越 GRASP 伪标签版本。
  • vs SSD (Sehwag et al., 2021):SSD 用自监督学习避免标签依赖,但在图上效率低(部分数据集超出时间限制);RSL 更高效且更有效。

评分

  • 新颖性: ⭐⭐⭐⭐⭐ Feature Resonance 现象是全新发现,提供了 OOD 检测的新视角
  • 实验充分度: ⭐⭐⭐⭐⭐ 13 个数据集、21 个 baseline、丰富的消融和分析
  • 写作质量: ⭐⭐⭐⭐ 物理类比直觉好,理论分析完整,实验组织清晰
  • 价值: ⭐⭐⭐⭐ 无监督图 OOD 检测的重要进展,标签无关特性有广泛适用性

相关论文