跳转至

HOG-Diff: Higher-Order Guided Diffusion for Graph Generation

一句话总结

本文提出 HOG-Diff,一个利用高阶拓扑结构(如环、三角形、motif)作为生成引导的图扩散框架,通过胞复形过滤(CCF)提取高阶骨架并结合广义 OU 扩散桥实现"由粗到细"的渐进式图生成,在分子和通用图生成的 8 个基准上取得了 SOTA 性能。

背景与动机

  1. 现有图扩散模型忽略高阶拓扑:当前主流图生成方法(如 GDSS、DiGress、DeFoG)直接在邻接矩阵或边级别操作,将图视为成对边的集合,完全忽略了三角形、环、团等高阶结构。然而这些结构在化学分子(如苯环、杂环)和生物网络中至关重要。

  2. 中间状态退化为无结构噪声:经典扩散模型的前向过程将数据逐步加噪至高斯分布,中间状态是无意义的噪声邻接矩阵,既不保留图的拓扑性质也无法提供有用的结构引导。

  3. 分子生成中环系统的重要性:已批准药物分子仅包含约几百种不同的环系统,远少于天文数字级的化学空间(\(10^{23}\)\(10^{60}\)),这说明高阶拓扑结构是真实分子分布的核心约束。

  4. 拓扑深度学习的成功启示:TDL 研究已证明显式建模复杂拓扑结构(simplicial complex、cell complex)可提升图表示学习的表达力和稳定性,但尚未被引入生成模型。

  5. 邻接矩阵域扩散的缺陷:直接在邻接矩阵上注入高斯噪声面临排列歧义、稀疏性导致信号退化、以及可扩展性差等问题。谱域扩散提供了更稳健的替代方案。

  6. 缺乏拓扑感知的质量评估:现有评价指标(如 Validity、FCD)主要关注化学有效性和分布距离,很少评估生成图的拓扑保持能力。需要基于曲率过滤等 TDA 方法的评估。

方法详解

整体框架:由粗到细的拓扑引导生成

HOG-Diff 的核心思想是将图生成分解为层次化的子任务:

  1. 图的胞复形提升(Lifting):将原始图 \(\bm{G}\) 提升为胞复形 \(\mathcal{S}\),通过在图中的简单环上粘贴 2 维闭盘来构造 2-cell
  2. 胞复形过滤(CCF):定义 \(p\)-cell 过滤操作,提取仅属于高阶 cell 的节点和边,得到"高阶骨架" \(\bm{G}_{[p]}\)
  3. 层次化扩散:将扩散过程划分为 \(K\) 个层次化时间窗口 \(\{[\tau_{k-1}, \tau_k]\}\),高阶骨架作为中间目标状态

生成过程的联合分布被分解为:

\[p(\bm{G}_0) = p(\bm{G}_0|\bm{G}_{\tau_1}) \cdot p(\bm{G}_{\tau_1}|\bm{G}_{\tau_2}) \cdots p(\bm{G}_{\tau_{K-1}}|\bm{G}_T)\]

广义 OU 扩散桥

每个时间窗口内使用广义 Ornstein-Uhlenbeck (GOU) 桥过程连接相邻中间状态。GOU 过程由以下 SDE 控制:

\[\mathrm{d}\bm{G}_t = \theta_t(\bm{\mu} - \bm{G}_t)\mathrm{d}t + g_t\mathrm{d}\bm{W}_t\]

通过 Doob's \(h\)-transform 施加终端约束 \(\bm{\mu} = \bm{G}_{\tau_k}\),得到桥过程的闭式转移概率,支持无模拟训练(simulation-free training)。

关键优势: - 布朗桥是 GOU 桥的特例(\(\theta_t \to 0\)) - 闭式条件概率 \(p(\bm{G}_t|\bm{G}_{\tau_{k-1}}, \bm{G}_{\tau_k})\) 支持一步前向采样 - 终端状态方差为零,确保平滑过渡到预定义的中间结构

谱域扩散

在图 Laplacian \(\bm{L} = \bm{D} - \bm{A}\) 的谱域上进行扩散,而非直接在邻接矩阵上。对 \(\bm{L} = \bm{U}\bm{\Lambda}\bm{U}^\top\) 分解后,对特征值 \(\bm{\Lambda}\) 和节点特征 \(\bm{X}\) 分别建立扩散过程:

  • 利用 Laplacian 谱的排列不变性解决排列歧义
  • 特征值扩散捕获全局拓扑结构
  • 节点特征扩散处理局部属性

评分网络

采用双模块架构:GCN(局部特征聚合)+ Graph Transformer(全局信息提取),通过 FiLM 层融合时间信息,分别用 MLP 预测节点和谱的 score function。整个网络具有排列等变性。

实验结果

分子生成(QM9、ZINC250k、MOSES、GuacaMol)

方法 QM9 FCD↓ QM9 NSPDK↓ ZINC FCD↓ ZINC NSPDK↓ MOSES Val.↑ GuacaMol FCD↑
GDSS 2.900 0.003 14.656 0.019
DiGress 0.360 0.0005 23.060 0.082 85.7 68.0
Cometh 0.248 0.0005 90.5 72.7
DeFoG 0.268 0.0005 2.030 0.002 92.8 73.8
HOG-Diff 0.172 0.0003 1.633 0.001 99.7 78.5

HOG-Diff 在 FCD 和 NSPDK 上大幅领先,表明生成分子的分布与真实分子在化学空间和图空间中都更接近。在大规模 MOSES 数据集上 Validity 达 99.7%,远超其他方法。

通用图生成 + 拓扑保持分析

方法 Community-small Avg.↓ Enzymes Avg.↓ QM9 \(\kappa_{FR}\) ZINC \(\kappa_{FR}\)
GDSS 0.046 0.032 0.925 1.781
DiGress 0.038 0.030 0.251
DeFoG 0.177 0.728
HOG-Diff 0.010 0.027 0.077 0.190

在基于 Curvature Filtration 的拓扑评估中,HOG-Diff 在所有数据集上均取得最低距离分数,尤其在复杂分子数据集上优势显著(QM9 上 \(\kappa_{FR}\) 比次优方法低 56%)。

消融实验:拓扑引导的重要性

引导类型 QM9 Val.↑ QM9 FCD↓ QM9 NSPDK↓
Noise(经典扩散) 91.52 0.829 0.0015
Peripheral(外围结构) 97.58 0.305 0.0009
Cell(高阶骨架) 98.74 0.172 0.0003

高阶骨架引导远优于噪声引导(经典扩散)和外围结构引导,验证了高阶拓扑作为生成信号的有效性。训练曲线也证实了 HOG-Diff 的收敛速度快于经典方法(与 Theorem 3 一致)。

亮点

  • 首次将高阶拓扑作为图生成的显式引导信号:不同于以往将拓扑视为后验评估指标,HOG-Diff 将其嵌入生成过程的核心
  • 胞复形过滤的优雅设计:CCF 操作避免了昂贵的完整 lifting 枚举,高效提取高阶骨架作为中间目标
  • 理论与实践的统一:证明了 HOG-Diff 在 score matching 收敛速度和重建误差界上严格优于经典扩散模型(Theorem 3 & 4),并通过实验验证
  • 全面的评估体系:覆盖 8 个基准、4 种分子数据集、引入 Curvature Filtration 作为拓扑保持指标

局限性

  • CCF 依赖于 lifting 操作的质量,不同的 lifting 策略(2-cell vs simplicial complex)可能对不同数据集有不同效果,需要手动选择
  • 在高阶结构较少的数据集(如 Ego-small)上优势不显著,说明方法的收益与数据本身的拓扑丰富度强相关
  • 谱域扩散需要选择固定的特征向量基 \(\hat{\bm{U}}_0\)(从训练集中采样),这引入了额外的采样偏差
  • 两阶段方法(\(K=2\))增加了超参数(时间窗口划分 \(\tau_k\)、系数 \(c_1, c_2\)),调参负担较经典方法更重
  • 尚未探索更高维(3-cell 及以上)拓扑引导的效果

相关工作对比

维度 HOG-Diff DiGress (Vignac et al. 2023) DeFoG (Qin et al. 2025)
扩散域 谱域(Laplacian 特征值) 离散空间(categorical) 流匹配
高阶拓扑 显式引导(CCF)
中间状态 有意义的拓扑骨架 噪声 最优传输路径
桥过程 GOU 桥(闭式)
理论保证 收敛速度 + 误差界
MOSES Val. 99.7% 85.7% 92.8%
维度 HOG-Diff GDSS (Jo et al. 2022) MiCaM (Geng et al. 2023)
生成范式 一次性(谱扩散) 一次性(邻接矩阵扩散) 自回归(motif 合并)
高阶信息 生成引导 隐式(motif 词表)
拓扑保持 优秀(\(\kappa_{FR}\) 最低) 差(\(\kappa_{FR}\) 高) 中等
可扩展性 大规模(MOSES/GuacaMol) 中等 受限于 motif 词表
可解释性 可分析不同引导的影响 有限

评分

  • ⭐⭐⭐⭐⭐ 创新性:首次系统化地将高阶拓扑引入图扩散框架,CCF + GOU 桥的组合设计优雅且有理论支撑
  • ⭐⭐⭐⭐⭐ 实验充分度:8 个基准、全面的 baseline 对比、拓扑评估、消融实验和理论验证,覆盖全面
  • ⭐⭐⭐⭐ 写作质量:整体结构清晰,数学推导严谨,但符号较多且 preliminaries 偏长
  • ⭐⭐⭐⭐ 实用价值:对分子生成和药物发现有直接应用价值,拓扑引导思想可推广到更多场景