GGBall: Graph Generative Model on Poincaré Ball¶

会议: ICLR 2026
arXiv: 2506.07198
代码: GitHub
领域: 图生成 / 双曲几何
关键词: 双曲空间, 图生成, Poincaré球模型, 向量量化, Flow Matching

一句话总结¶

提出 GGBall，首个完全基于 Poincaré 球模型的图生成框架，通过双曲向量量化自编码器（HVQVAE）和黎曼流匹配先验，在层次图和分子图生成上达到 SOTA，在层次图数据集上平均生成误差降低 18%。

两阶段生成：(1) 在 Poincaré 球上编码图结构为离散隐空间令牌（HVQVAE）；(2) 用黎曼流匹配建模隐空间先验，生成时从先验采样→量化→解码。GNN 编码局部结构，Transformer 传播全局依赖。

Poincaré 图神经网络 (Poincaré GNN):
- 功能：在双曲空间中进行消息传递，将边和节点信息编码到节点表示中
- 核心思路：切空间聚合 + 距离调制消息函数。使用 \(\log_0^c(\cdot)\) / \(\exp_0^c(\cdot)\) 在切空间聚合后映射回流形
- 消息调制：\(\text{M}(\mathbf{m}_{ij}) = \gamma_{ij} \cdot \mathbf{m}_{ij} + \beta_{ij}\)，其中 \(\gamma_{ij}, \beta_{ij}\) 是双曲距离 \(d_c(\mathbf{h}_i, \mathbf{h}_j)\) 的函数
- 设计动机：曲率感知的距离调制使模型能直接编码层次关系的强度
Poincaré Diffusion Transformer:
- 功能：建模全局图结构，替代点积注意力为测地线距离注意力
- 测地线注意力：\(\alpha_{ij} \propto \exp(-\tau d_c(\mathbf{q}_i, \mathbf{k}_j))\)
- 值聚合用 Möbius gyromidpoint 保持几何一致性
- 时间调制：注入时间步嵌入用于流匹配先验
双曲向量量化自编码器 (HVQVAE):
- 功能：将连续双曲嵌入离散化到可学习的 Poincaré 码本 \(\mathcal{C}\)
- 核心思路：用测地线距离最近邻量化 \(\mathbf{z}_q = \arg\min_{\mathbf{c}_j} d_c(\mathbf{z}, \mathbf{c}_j)\)
- 码本初始化用双曲 k-means 聚类，黎曼优化器更新
- 稳定机制：过期阈值替换不活跃码本条目，加权 Einstein 中点更新

自编码器损失：重建损失 + 度-边一致性损失 + L2 正则
HVQVAE 损失：\(\mathcal{L}_{\text{HVQVAE}} = \lambda_1 \mathcal{L}_{\text{AE}} + \lambda_2 \mathbb{E}[d_c^2(\text{sg}(\mathbf{z}_q), \mathbf{z})] + \lambda_3 \mathbb{E}[d_c^2(\mathbf{z}_q, \text{sg}(\mathbf{z}))]\)
流匹配先验：黎曼条件流匹配目标，测地线插值路径

方法	Community-small Avg↓	Ego-small Avg↓	空间
GraphVAE	0.6233	0.1167	欧氏
GDSS	0.0460	0.0173	图空间
DiGress	0.0380	-	图空间
HGDM	0.0240	0.0137	混合
GGBall	0.0197	0.0117	双曲

方法	Validity↑	Uniqueness↑	Novelty↑	V.U.N↑
DiGress	99.00	96.34	32.51	31.04
CatFlow	98.47	97.58	65.62	63.02
GGBall	98.33	96.38	93.77	88.45