HOG-Diff: Higher-Order Guided Diffusion for Graph Generation¶
一句话总结¶
本文提出 HOG-Diff,一个利用高阶拓扑结构(如环、三角形、motif)作为生成引导的图扩散框架,通过胞复形过滤(CCF)提取高阶骨架并结合广义 OU 扩散桥实现"由粗到细"的渐进式图生成,在分子和通用图生成的 8 个基准上取得了 SOTA 性能。
背景与动机¶
-
现有图扩散模型忽略高阶拓扑:当前主流图生成方法(如 GDSS、DiGress、DeFoG)直接在邻接矩阵或边级别操作,将图视为成对边的集合,完全忽略了三角形、环、团等高阶结构。然而这些结构在化学分子(如苯环、杂环)和生物网络中至关重要。
-
中间状态退化为无结构噪声:经典扩散模型的前向过程将数据逐步加噪至高斯分布,中间状态是无意义的噪声邻接矩阵,既不保留图的拓扑性质也无法提供有用的结构引导。
-
分子生成中环系统的重要性:已批准药物分子仅包含约几百种不同的环系统,远少于天文数字级的化学空间(\(10^{23}\)–\(10^{60}\)),这说明高阶拓扑结构是真实分子分布的核心约束。
-
拓扑深度学习的成功启示:TDL 研究已证明显式建模复杂拓扑结构(simplicial complex、cell complex)可提升图表示学习的表达力和稳定性,但尚未被引入生成模型。
-
邻接矩阵域扩散的缺陷:直接在邻接矩阵上注入高斯噪声面临排列歧义、稀疏性导致信号退化、以及可扩展性差等问题。谱域扩散提供了更稳健的替代方案。
-
缺乏拓扑感知的质量评估:现有评价指标(如 Validity、FCD)主要关注化学有效性和分布距离,很少评估生成图的拓扑保持能力。需要基于曲率过滤等 TDA 方法的评估。
方法详解¶
整体框架:由粗到细的拓扑引导生成¶
HOG-Diff 的核心思想是将图生成分解为层次化的子任务:
- 图的胞复形提升(Lifting):将原始图 \(\bm{G}\) 提升为胞复形 \(\mathcal{S}\),通过在图中的简单环上粘贴 2 维闭盘来构造 2-cell
- 胞复形过滤(CCF):定义 \(p\)-cell 过滤操作,提取仅属于高阶 cell 的节点和边,得到"高阶骨架" \(\bm{G}_{[p]}\)
- 层次化扩散:将扩散过程划分为 \(K\) 个层次化时间窗口 \(\{[\tau_{k-1}, \tau_k]\}\),高阶骨架作为中间目标状态
生成过程的联合分布被分解为:
广义 OU 扩散桥¶
每个时间窗口内使用广义 Ornstein-Uhlenbeck (GOU) 桥过程连接相邻中间状态。GOU 过程由以下 SDE 控制:
通过 Doob's \(h\)-transform 施加终端约束 \(\bm{\mu} = \bm{G}_{\tau_k}\),得到桥过程的闭式转移概率,支持无模拟训练(simulation-free training)。
关键优势: - 布朗桥是 GOU 桥的特例(\(\theta_t \to 0\)) - 闭式条件概率 \(p(\bm{G}_t|\bm{G}_{\tau_{k-1}}, \bm{G}_{\tau_k})\) 支持一步前向采样 - 终端状态方差为零,确保平滑过渡到预定义的中间结构
谱域扩散¶
在图 Laplacian \(\bm{L} = \bm{D} - \bm{A}\) 的谱域上进行扩散,而非直接在邻接矩阵上。对 \(\bm{L} = \bm{U}\bm{\Lambda}\bm{U}^\top\) 分解后,对特征值 \(\bm{\Lambda}\) 和节点特征 \(\bm{X}\) 分别建立扩散过程:
- 利用 Laplacian 谱的排列不变性解决排列歧义
- 特征值扩散捕获全局拓扑结构
- 节点特征扩散处理局部属性
评分网络¶
采用双模块架构:GCN(局部特征聚合)+ Graph Transformer(全局信息提取),通过 FiLM 层融合时间信息,分别用 MLP 预测节点和谱的 score function。整个网络具有排列等变性。
实验结果¶
分子生成(QM9、ZINC250k、MOSES、GuacaMol)¶
| 方法 | QM9 FCD↓ | QM9 NSPDK↓ | ZINC FCD↓ | ZINC NSPDK↓ | MOSES Val.↑ | GuacaMol FCD↑ |
|---|---|---|---|---|---|---|
| GDSS | 2.900 | 0.003 | 14.656 | 0.019 | — | — |
| DiGress | 0.360 | 0.0005 | 23.060 | 0.082 | 85.7 | 68.0 |
| Cometh | 0.248 | 0.0005 | — | — | 90.5 | 72.7 |
| DeFoG | 0.268 | 0.0005 | 2.030 | 0.002 | 92.8 | 73.8 |
| HOG-Diff | 0.172 | 0.0003 | 1.633 | 0.001 | 99.7 | 78.5 |
HOG-Diff 在 FCD 和 NSPDK 上大幅领先,表明生成分子的分布与真实分子在化学空间和图空间中都更接近。在大规模 MOSES 数据集上 Validity 达 99.7%,远超其他方法。
通用图生成 + 拓扑保持分析¶
| 方法 | Community-small Avg.↓ | Enzymes Avg.↓ | QM9 \(\kappa_{FR}\)↓ | ZINC \(\kappa_{FR}\)↓ |
|---|---|---|---|---|
| GDSS | 0.046 | 0.032 | 0.925 | 1.781 |
| DiGress | 0.038 | 0.030 | 0.251 | — |
| DeFoG | — | — | 0.177 | 0.728 |
| HOG-Diff | 0.010 | 0.027 | 0.077 | 0.190 |
在基于 Curvature Filtration 的拓扑评估中,HOG-Diff 在所有数据集上均取得最低距离分数,尤其在复杂分子数据集上优势显著(QM9 上 \(\kappa_{FR}\) 比次优方法低 56%)。
消融实验:拓扑引导的重要性¶
| 引导类型 | QM9 Val.↑ | QM9 FCD↓ | QM9 NSPDK↓ |
|---|---|---|---|
| Noise(经典扩散) | 91.52 | 0.829 | 0.0015 |
| Peripheral(外围结构) | 97.58 | 0.305 | 0.0009 |
| Cell(高阶骨架) | 98.74 | 0.172 | 0.0003 |
高阶骨架引导远优于噪声引导(经典扩散)和外围结构引导,验证了高阶拓扑作为生成信号的有效性。训练曲线也证实了 HOG-Diff 的收敛速度快于经典方法(与 Theorem 3 一致)。
亮点¶
- 首次将高阶拓扑作为图生成的显式引导信号:不同于以往将拓扑视为后验评估指标,HOG-Diff 将其嵌入生成过程的核心
- 胞复形过滤的优雅设计:CCF 操作避免了昂贵的完整 lifting 枚举,高效提取高阶骨架作为中间目标
- 理论与实践的统一:证明了 HOG-Diff 在 score matching 收敛速度和重建误差界上严格优于经典扩散模型(Theorem 3 & 4),并通过实验验证
- 全面的评估体系:覆盖 8 个基准、4 种分子数据集、引入 Curvature Filtration 作为拓扑保持指标
局限性¶
- CCF 依赖于 lifting 操作的质量,不同的 lifting 策略(2-cell vs simplicial complex)可能对不同数据集有不同效果,需要手动选择
- 在高阶结构较少的数据集(如 Ego-small)上优势不显著,说明方法的收益与数据本身的拓扑丰富度强相关
- 谱域扩散需要选择固定的特征向量基 \(\hat{\bm{U}}_0\)(从训练集中采样),这引入了额外的采样偏差
- 两阶段方法(\(K=2\))增加了超参数(时间窗口划分 \(\tau_k\)、系数 \(c_1, c_2\)),调参负担较经典方法更重
- 尚未探索更高维(3-cell 及以上)拓扑引导的效果
相关工作对比¶
| 维度 | HOG-Diff | DiGress (Vignac et al. 2023) | DeFoG (Qin et al. 2025) |
|---|---|---|---|
| 扩散域 | 谱域(Laplacian 特征值) | 离散空间(categorical) | 流匹配 |
| 高阶拓扑 | 显式引导(CCF) | 无 | 无 |
| 中间状态 | 有意义的拓扑骨架 | 噪声 | 最优传输路径 |
| 桥过程 | GOU 桥(闭式) | 无 | 无 |
| 理论保证 | 收敛速度 + 误差界 | 无 | 无 |
| MOSES Val. | 99.7% | 85.7% | 92.8% |
| 维度 | HOG-Diff | GDSS (Jo et al. 2022) | MiCaM (Geng et al. 2023) |
|---|---|---|---|
| 生成范式 | 一次性(谱扩散) | 一次性(邻接矩阵扩散) | 自回归(motif 合并) |
| 高阶信息 | 生成引导 | 无 | 隐式(motif 词表) |
| 拓扑保持 | 优秀(\(\kappa_{FR}\) 最低) | 差(\(\kappa_{FR}\) 高) | 中等 |
| 可扩展性 | 大规模(MOSES/GuacaMol) | 中等 | 受限于 motif 词表 |
| 可解释性 | 可分析不同引导的影响 | 无 | 有限 |
评分¶
- ⭐⭐⭐⭐⭐ 创新性:首次系统化地将高阶拓扑引入图扩散框架,CCF + GOU 桥的组合设计优雅且有理论支撑
- ⭐⭐⭐⭐⭐ 实验充分度:8 个基准、全面的 baseline 对比、拓扑评估、消融实验和理论验证,覆盖全面
- ⭐⭐⭐⭐ 写作质量:整体结构清晰,数学推导严谨,但符号较多且 preliminaries 偏长
- ⭐⭐⭐⭐ 实用价值:对分子生成和药物发现有直接应用价值,拓扑引导思想可推广到更多场景