ICML2025 医学图像 Noise-Conditioned Graph Networks 扩散模型 Flow Matching 动态消息传递图粗粒化 3D 点云生成

Geometric Generative Modeling with Noise-Conditioned Graph Networks¶

会议: ICML2025
arXiv: 2507.09391
代码: GitHub
领域: 图生成 / 几何深度学习
关键词: Noise-Conditioned Graph Networks, 扩散模型, Flow Matching, 动态消息传递, 图粗粒化, 3D 点云生成

一句话总结¶

提出 Noise-Conditioned Graph Networks (NCGNs)，使 GNN 架构根据噪声级别动态调整消息传递的范围和图分辨率：高噪声时用远程连接+低分辨率，低噪声时用局部连接+高分辨率，在 3D 点云、空间转录组和图像生成中均超越固定架构基线。

研究背景与动机¶

领域现状¶

领域现状：几何图生成的重要性**：3D 点云、分子结构、空间基因组学等都涉及带空间信息的图结构生成。

现有痛点¶

现有痛点：现有 GNN 的静态局限**：流式生成模型中的 GNN 在整个去噪过程中使用固定的 kNN 或半径图，忽略了噪声级别对图信号的影响。

核心矛盾¶

核心矛盾：信息论动机**：理论分析表明，噪声增大时恢复信号需要更远的邻居信息，且图可以用更低分辨率表示。

方法详解¶

理论基础¶

Lemma 3.1 (互信息公式)：给出了节点原始特征 \(x_1^{(i)}\) 与半径 \(r\) 内噪声特征聚合 \(Y_t^{(i,r)}\) 之间互信息的解析表达式。
Theorem 3.2 (范围递增)：当 SNR 下降时，存在更大半径 \(r_2 > r_1\) 使得 \(I(x_1^{(i)}, Y_{c_2}^{(r_2)}) > I(x_1^{(i)}, Y_{c_2}^{(r_1)})\)。
Proposition 3.3 (位置噪声)：噪声增大时，原本相近节点的期望距离增大，因此需要更大的消息传递半径。

Dynamic Message Passing (DMP)¶

给定边界条件 \((r_0, s_0)\) 和 \((r_1, s_1)\) 以及自适应调度函数 \(f\)：

\[r_t, s_t = f(t, r_0, r_1, s_0, s_1)\]

约束条件： - 单调性：\(t' < t\)（更高噪声）\(\Rightarrow r' \geq r, s' \leq s\) - 边界一致：\(f(0) = (r_0, s_0)\)，\(f(1) = (r_1, s_1)\)

每步操作： 1. 图粗粒化：将 \(N\) 个节点聚合为 \(s_t\) 个超节点（体素聚类/均值池化）。 2. 连接构建：按 \(r_t\) 构建 kNN/半径图。 3. 消息传递：在粗粒化图上做 GCN/GAT。 4. 反粗粒化：将信息映射回原始节点。

复杂度¶

当 \(r_t \cdot s_t = r_1 N\) 时，消息传递在整个生成过程中保持线性时间复杂度。

实验关键数据¶

主实验 1：3D 点云生成 (ModelNet40)¶

方法	GCN \(\mathcal{W}_2\) (×10⁻²)	GAT \(\mathcal{W}_2\) (×10⁻²)
Random	8.624	8.624
KNN	5.882	5.598
Long-Short Range	4.315	4.741
DMP	4.215	4.263

平均提升 16.15%。

主实验 2：空间转录组学¶

DMP 在 GCN 上全面优于 kNN 和全连接基线，GAT 上可比。

主实验 3：图像生成 (DiT-DMP)¶

	DiT	DiT-DMP
FID↓	84.051	63.983
IS↑	16.735	24.681
Precision↑	0.296	0.446

仅修改两行代码（FlexiViT 动态 patch + 邻域注意力）即可显著提升。

消融：调度函数选择¶

指数调度最佳 (\(\mathcal{W}_2 = 4.263 \times 10^{-2}\))，线性和 ReLU 也优于基线，对数调度不及基线。

亮点与洞察¶

信息论视角的理论支撑：SNR 下降→最优半径增大→图分辨率可降低，提供了动态架构的理论依据。
简单强大的实现：DMP 可以通过最小代码修改集成到现有模型（如 DiT）。
线性复杂度：通过粗粒化平衡连接范围的增大，避免了全连接的二次复杂度。
注意力权重的实证：训练后的 GAT 注意力分布确实随噪声级别变化，验证了理论预测。

局限与展望¶

调度函数 \(f\) 是预定义的，未学习最优调度。
仅调整连接范围和分辨率，未探索其他可调整维度（层数、宽度、消息传递类型）。
粗粒化策略（体素聚类）可能不是所有场景的最优选择。
Theorem 3.2 的理论假设（相关结构）在实践中可能不严格成立。

评分¶

新颖性: ⭐⭐⭐⭐⭐
实验充分度: ⭐⭐⭐⭐
写作质量: ⭐⭐⭐⭐⭐
价值: ⭐⭐⭐⭐⭐