跳转至

EMGauss: Continuous Slice-to-3D Reconstruction via Dynamic Gaussian Modeling in Volume Electron Microscopy

会议: CVPR 2026
arXiv: 2512.06684
代码: 无
领域: 3D视觉
关键词: 3D高斯溅射, 体电子显微镜, 各向异性重建, 动态场景建模, 自监督学习

一句话总结

将体电子显微镜(vEM)的各向异性切片重建问题重新建模为基于可变形2D高斯溅射的动态3D场景渲染任务,通过Teacher-Student伪标签机制在数据稀疏条件下实现高保真连续切片合成。

研究背景与动机

体电子显微镜(vEM)能够实现生物结构的纳米级3D成像,但由于分辨率、视场和采集时间之间的"不可能三角"权衡,直接获取各向同性数据代价高昂。实际采集的数据通常呈现各向异性特征——轴向(z)分辨率远低于面内(xy)分辨率。

现有深度学习方法试图通过以下两种范式恢复各向同性: 1. 视频帧插值:沿z轴对xy切片进行帧插值 2. 图像超分辨率:对xz/yz正交视图进行超分辨率增强

这两种方法都隐含地假设组织结构在x/y/z三个维度上近似各向同性,但实际生物样本中形态学各向异性普遍存在(如神经纤维、树突棘等),导致这些方法在处理方向性强的结构时产生误差。

核心动机:需要一种不依赖各向同性假设、直接在连续3D空间中进行推理的重建框架。

方法详解

整体框架

EMGauss将各向异性体重建问题重构为动态3D场景渲染问题: - 将轴向切片序列视为2D高斯点云的时间演化过程 - 切片索引 \(t \in [0,1]\) 作为沿z轴的归一化空间坐标 - 通过变形MLP学习相邻切片之间的局部几何变化

基础构件源自Deformable 3D Gaussians,每个高斯基元参数化为:不透明度 \(o\)、中心 \(\mu\)、协方差矩阵 \(\Sigma\)(分解为缩放 \(S\) 和旋转 \(R\))。

关键设计

1. Slice-to-3D动态高斯建模

从观测的各向异性帧初始化的典范高斯集 \(\mathcal{G}_c\) 出发,变形网络 \(\Phi_\theta\) 预测每个高斯的局部偏移:

\[\Delta\mu_i, \Delta S_i, \Delta o_i = \Phi_\theta(\mu_i, t)\]

关键约束设计: - 位置偏移:仅允许面内位移 \(\Delta\mu_i = (\Delta x_i, \Delta y_i, 0)\) - 缩放偏移:仅允许面内缩放 \(\Delta S_i = (\Delta s_x, \Delta s_y, 0)\) - 不透明度:允许沿z轴的动态变化 \(\Delta o_i\) - z坐标和z缩放:固定为全局常数 \(z_0, s_{z,0}\) - 旋转:可学习但不随时间变化,即 \(\Delta R_i = 0\)

这些约束确保了轴向对齐的一致性,同时允许面内变形和逐切片外观变化。推理时通过查询中间 \(t\) 值生成变形后的高斯集并渲染。

2. Teacher-Student伪标签自举机制

针对仅有少量轴向切片(10%-20%)的数据稀疏情况:

组件 设计 作用
Teacher模型 Student的EMA版本,衰减率 \(\alpha=0.995\) 在未见切片上生成稳定伪目标
Student模型 主动训练的模型 学习匹配Teacher的伪标签
激活策略 训练迭代超过阈值后启动 确保初始收敛后再引入伪监督
扩展策略 从中间切片逐步扩展到更多位置 渐进式覆盖未观测区域

伪监督迭代与真实数据监督迭代交替进行,确保平衡学习和稳定收敛。

损失函数 / 训练策略

三阶段训练流水线

阶段 迭代数 操作 目的
预热阶段 2k 优化典范高斯集 \(\mathcal{G}_c\),冻结变形MLP 建立稳定辐射基线
联合训练 1k 同时训练 \(\mathcal{G}_c\) 和变形MLP 捕获轴向转换(过长易过拟合)
Teacher-Student 15k 激活EMA Teacher提供伪监督 增强未见切片的重建质量

损失函数: - 基于RGB光度监督:\(\ell_1\) 损失 + D-SSIM正则化 - 伪监督损失权重线性增加:从0.1逐步提升到1.0(3k-10k迭代之间)

实验关键数据

主实验

数据集:EPFL(小鼠脑,5nm各向同性)、FIB-25(果蝇脑,8nm各向同性)、FANC(果蝇神经索,真实各向异性×10)

Table 2: 合成各向异性数据集上的xy切片重建结果

方法 EPFL PSNR EPFL SSIM EPFL FSIM FIB-25 PSNR FIB-25 SSIM FIB-25 FSIM
CycleGAN-IR 22.05 0.491 0.856 22.39 0.554 0.856
EMDiffuse† 23.34 0.519 0.899 24.10 0.514 0.878
IsoVEM 23.91 0.597 0.856 21.51 0.546 0.846
EMGauss 26.59 0.698 0.943 27.37 0.728 0.920

†EMDiffuse需要额外数据训练

Table 3: EPFL数据集上的下游分割结果(SAM2, IoU)

方法 CycleGAN-IR EMDiffuse EMGauss
IoU 0.9099 0.9555 0.9687

消融实验

Table 4: 关键组件消融(两个各向同性数据集平均)

配置 PSNR SSIM FSIM
去除Teacher-Student 25.19 0.627 0.904
去除预热阶段 25.76 0.653 0.908
去除联合训练 24.35 0.577 0.851
去除动态不透明度 \(\Delta o\) 25.44 0.630 0.894
添加动态旋转 \(\Delta R\) 25.07 0.640 0.906
完整模型 26.98 0.713 0.932

关键发现

  1. EMGauss在PSNR上比最佳baseline高出 ~3dB(EPFL和FIB-25)
  2. 在xz/yz切片重建中,即使EMGauss仅用xy训练,效果仍优于用xz/yz训练的baseline
  3. 在真实各向异性FANC数据集(×10各向异性)上,EMGauss是唯一支持任意时间步连续生成的方法
  4. 三阶段训练中,联合训练阶段的去除影响最大(PSNR下降2.6)
  5. 动态不透明度比动态旋转更重要——静态不透明度无法建模结构的出现/消失,而动态旋转会引起时间抖动

亮点与洞察

  1. 问题转化的巧妙性:将切片重建转化为动态场景渲染,从根本上避免了各向同性假设
  2. 完全自包含:仅使用目标体积的各向异性切片进行优化,无需外部数据集或大规模预训练
  3. 连续生成能力:可在任意深度合成插值切片,这是基于离散帧插值方法无法实现的
  4. 高斯属性的精细控制:对哪些属性随时间变化、哪些固定做了仔细设计,体现了对问题本质的深入理解

局限性 / 可改进方向

  1. 在噪声较大的输入切片中,高斯基元数量可能显著增长,导致内存消耗过大
  2. 可以在重建流水线前加入轻量去噪模块来稳定优化
  3. 未来可探索自适应高斯剪枝或与图像空间正则化器的联合学习
  4. 当前实验仅在电子显微镜领域验证,跨模态泛化能力有待证明

相关工作与启发

  • 与3DGS的关系:巧妙地将3DGS从多视图3D重建迁移到切片-体重建,将z轴重新解释为时间维度
  • 与Deformable 3DGS的区别:原始方法用于动态3D场景的多视图重建,本文用于从2D切片进行3D连续重建
  • 与扩散/GAN方法的本质区别:不依赖跨域映射(xy→xz/yz),直接建模连续3D几何
  • 启发:该范式可推广到其他平面扫描成像领域(如CT、MRI等)

评分

  • 新颖性: ⭐⭐⭐⭐⭐ — 问题转化思路独到,3DGS在医学成像中的创新应用
  • 实验充分度: ⭐⭐⭐⭐ — 多数据集多指标验证,含下游任务和消融,但跨模态实验缺乏
  • 写作质量: ⭐⭐⭐⭐ — 结构清晰,动机阐述充分
  • 价值: ⭐⭐⭐⭐ — 提供了通用的slice-to-3D重建框架,超越vEM领域