SpatialMAGIC: A Hybrid Framework Integrating Graph Diffusion and Spatial Attention for Spatial Transcriptomics Imputation¶

日期: 2026-03-06
arXiv: 2603.06780
代码: https://github.com/sayeemzzaman/SpatialMAGIC
领域: 生物信息学 / 空间转录组学
关键词: spatial transcriptomics, graph diffusion, spatial self-attention, imputation, clustering

一句话总结¶

提出 SpatialMAGIC，将 MAGIC 图扩散与 Transformer 空间自注意力融合，对空间转录组数据进行缺失值填补，在多平台上实现聚类精度和生物可解释性的双提升。

研究背景与动机¶

领域现状: 空间转录组学（ST）可在组织空间上下文中映射基因表达，但高分辨率数据（如 Stereo-seq）极度稀疏，超过 84% 的表达值为零。
现有痛点: 已有方法面临关键取舍——图神经网络/扩散模型计算开销大、扩展性差；单纯的图扩散方法（如 MAGIC）无法利用空间坐标信息；深度学习模型在全局扩散与局部结构保持之间难以平衡。
核心矛盾: 现有方法要么只用基因表达相似性（忽略空间位置），要么计算代价过高难以应用于大规模数据集（>50k spots）。
切入角度: 同时利用基因表达的图扩散（捕获长程依赖）和空间坐标的 Transformer 注意力（捕获局部空间结构），通过融合模块统一两种信息。
核心idea一句话: 用 MAGIC 图扩散做全局去噪 + Transformer 空间注意力做局部感知，再用自编码器融合两路信息完成最终填补。

方法详解¶

整体框架¶

输入基因表达矩阵 \(\mathbf{X} \in \mathbb{R}^{n \times g}\) 和空间坐标 \(\mathbf{S} \in \mathbb{R}^{n \times 2}\)。流程分三步：(1) MAGIC 图扩散对表达矩阵去噪填补；(2) Transformer 编码空间坐标生成空间嵌入；(3) 融合两路信息通过编码器-解码器重建增强表达谱。

关键设计¶

MAGIC 图扩散模块:
- 对表达矩阵 PCA 降维后构建 kNN 图（\(k=5\)，最大邻居 \(k_{max}=15\)）
- 用自适应高斯核计算亲和矩阵，对称化后行归一化得到转移矩阵 \(\mathbf{P}\)
- 执行 \(t\) 步随机游走扩散 \(\mathbf{X}_{MAGIC} = \mathbf{P}^t \mathbf{X}_d\)，实现长程信息传播
- 核心思路：通过流形上的扩散过程平滑基因表达、恢复 dropout 值
Spatial Transformer Attention 模块:
- 将 2D 空间坐标线性映射到 \(d_s=32\) 维嵌入空间
- 通过单层 Transformer 编码器（\(h=2\) 头自注意力）学习全局空间依赖
- 投影到基因维度后与 MAGIC 输出拼接：\(\mathbf{X}_{fused} = [\mathbf{X}_{MAGIC} \| \mathbf{H}_{proj}]\)
- 设计动机：无需显式邻接矩阵或距离阈值，自适应学习空间关系
融合精炼模块（Autoencoder）:
- 编码器：\(2G \to 512 \to 256\) 的两层全连接 + ReLU + Dropout
- 解码器：\(256 \to 512 \to G\) 重建基因表达
- 训练时对 MAGIC 填补结果随机遮蔽 20%，迫使模型利用空间信息恢复缺失值

损失函数 / 训练策略¶

损失函数：MSE 重建误差 \(\mathcal{L} = \frac{1}{n}\sum_{i=1}^{n}\|\hat{\mathbf{x}}_i - \mathbf{x}_{MAGIC,i}\|_2^2\)
训练策略：Adam 优化器，batch size \(B=256\)，20% 随机 masking 策略增强鲁棒性
选取 top \(k=3000\) 高变异基因，PCA 降至 \(d=100\) 维

实验关键数据¶

主实验¶

数据集	Before	MAGIC	Attn PCA	Attn UMAP	SpatialMAGIC
DX6_D2 (Stereo-seq)	0.2661	0.2889	0.2818	0.2839	0.3254
DT2_D0 (Stereo-seq)	0.2847	0.3088	0.3194	0.3014	0.3301
FB2_D1 (Stereo-seq)	0.1679	0.2192	0.2580	0.2543	0.2993
stickles (Slide-seq)	0.1740	0.1764	0.2249	0.1736	0.2193
diabetes T4 (Slide-seq)	0.2657	0.2577	0.2336	0.2197	0.2688
WT1_T3 (Slide-seq)	0.2891	0.3049	0.2870	0.2287	0.3074
GSE166692 (Sci-space)	0.3095	0.4020	0.3717	0.3316	0.4216

指标为 Adjusted Rand Index (ARI)，越高越好

消融实验（运行时间对比）¶

数据集	MAGIC (s)	SpatialMAGIC (s)	倍数
DX6	191.50	291.56	1.52×
DT2	334.75	1451.36	4.3×
FB2	282.91	332.74	1.18×

实验环境：Kaggle GPU，双 NVIDIA Tesla T4 (15 GiB VRAM)，~30 GiB RAM

关键发现¶

SpatialMAGIC 在 7 个数据集中的 6 个上取得最佳 ARI，仅在 stickles 上略低于 Attention PCA
Sci-space 数据集上提升最大：ARI 从 0.3095 → 0.4216（+0.112）
差异表达基因分析显示填补后新检测到多个生物学相关基因（如 Mdm2、Plg、Ephx2）
通路富集分析验证了恢复基因参与代谢、转运和神经信号通路

亮点与洞察¶

双路互补设计: 图扩散捕获全局基因表达模式，空间注意力保持局部组织结构，二者互补性强
masking 训练策略: 20% 随机遮蔽训练让模型学会利用空间信息恢复缺失表达，类似 MAE 的思想
生物可解释性: 不仅提升聚类指标，还通过 DEG 分析和通路富集验证了填补结果的生物学意义
跨平台泛化：在 Stereo-seq、Slide-seq、Sci-space 三种技术平台上均有效

局限性 / 可改进方向¶

计算开销较高，DT2 数据集上达 4.3× MAGIC 运行时间，大规模数据需优化
Transformer 模块在超高分辨率数据集上可能是计算瓶颈，可引入稀疏注意力
缺乏与 DiffusionST、SpotDiff 等最新深度生成模型的直接对比
未在真实生物实验中验证填补结果的准确性
未来可融合多模态数据（组织学图像、蛋白组学）

评分¶

⭐⭐⭐ 新颖性：图扩散+空间注意力的组合思路直觉但有效，不算全新范式
⭐⭐⭐⭐ 有效性：7个数据集全面评估，大多数取得 SOTA，生物学验证充分
⭐⭐⭐ 效率：计算开销是主要瓶颈，部分数据集慢 4 倍以上
⭐⭐⭐ 写作：结构完整，实验详实，但公式符号略显冗余