EMGauss: Continuous Slice-to-3D Reconstruction via Dynamic Gaussian Modeling in Volume Electron Microscopy¶

会议: CVPR 2026
arXiv: 2512.06684
代码: 无
领域: 3D视觉
关键词: 3D高斯溅射, 体电子显微镜, 各向异性重建, 动态场景建模, 自监督学习

一句话总结¶

将体电子显微镜(vEM)的各向异性切片重建问题重新建模为基于可变形2D高斯溅射的动态3D场景渲染任务，通过Teacher-Student伪标签机制在数据稀疏条件下实现高保真连续切片合成。

研究背景与动机¶

体电子显微镜(vEM)能够实现生物结构的纳米级3D成像，但由于分辨率、视场和采集时间之间的"不可能三角"权衡，直接获取各向同性数据代价高昂。实际采集的数据通常呈现各向异性特征——轴向(z)分辨率远低于面内(xy)分辨率。

现有深度学习方法试图通过以下两种范式恢复各向同性： 1. 视频帧插值：沿z轴对xy切片进行帧插值 2. 图像超分辨率：对xz/yz正交视图进行超分辨率增强

这两种方法都隐含地假设组织结构在x/y/z三个维度上近似各向同性，但实际生物样本中形态学各向异性普遍存在（如神经纤维、树突棘等），导致这些方法在处理方向性强的结构时产生误差。

核心动机：需要一种不依赖各向同性假设、直接在连续3D空间中进行推理的重建框架。

方法详解¶

整体框架¶

EMGauss将各向异性体重建问题重构为动态3D场景渲染问题： - 将轴向切片序列视为2D高斯点云的时间演化过程 - 切片索引 \(t \in [0,1]\) 作为沿z轴的归一化空间坐标 - 通过变形MLP学习相邻切片之间的局部几何变化

基础构件源自Deformable 3D Gaussians，每个高斯基元参数化为：不透明度 \(o\)、中心 \(\mu\)、协方差矩阵 \(\Sigma\)（分解为缩放 \(S\) 和旋转 \(R\)）。

关键设计¶

1. Slice-to-3D动态高斯建模¶

从观测的各向异性帧初始化的典范高斯集 \(\mathcal{G}_c\) 出发，变形网络 \(\Phi_\theta\) 预测每个高斯的局部偏移：

\[\Delta\mu_i, \Delta S_i, \Delta o_i = \Phi_\theta(\mu_i, t)\]

关键约束设计： - 位置偏移：仅允许面内位移 \(\Delta\mu_i = (\Delta x_i, \Delta y_i, 0)\) - 缩放偏移：仅允许面内缩放 \(\Delta S_i = (\Delta s_x, \Delta s_y, 0)\) - 不透明度：允许沿z轴的动态变化 \(\Delta o_i\) - z坐标和z缩放：固定为全局常数 \(z_0, s_{z,0}\) - 旋转：可学习但不随时间变化，即 \(\Delta R_i = 0\)

这些约束确保了轴向对齐的一致性，同时允许面内变形和逐切片外观变化。推理时通过查询中间 \(t\) 值生成变形后的高斯集并渲染。

2. Teacher-Student伪标签自举机制¶

针对仅有少量轴向切片(10%-20%)的数据稀疏情况：

组件	设计	作用
Teacher模型	Student的EMA版本，衰减率 \(\alpha=0.995\)	在未见切片上生成稳定伪目标
Student模型	主动训练的模型	学习匹配Teacher的伪标签
激活策略	训练迭代超过阈值后启动	确保初始收敛后再引入伪监督
扩展策略	从中间切片逐步扩展到更多位置	渐进式覆盖未观测区域

伪监督迭代与真实数据监督迭代交替进行，确保平衡学习和稳定收敛。

损失函数 / 训练策略¶

三阶段训练流水线：

阶段	迭代数	操作	目的
预热阶段	2k	优化典范高斯集 \(\mathcal{G}_c\)，冻结变形MLP	建立稳定辐射基线
联合训练	1k	同时训练 \(\mathcal{G}_c\) 和变形MLP	捕获轴向转换（过长易过拟合）
Teacher-Student	15k	激活EMA Teacher提供伪监督	增强未见切片的重建质量

损失函数： - 基于RGB光度监督：\(\ell_1\) 损失 + D-SSIM正则化 - 伪监督损失权重线性增加：从0.1逐步提升到1.0（3k-10k迭代之间）

实验关键数据¶

主实验¶

数据集：EPFL（小鼠脑，5nm各向同性）、FIB-25（果蝇脑，8nm各向同性）、FANC（果蝇神经索，真实各向异性×10）

Table 2: 合成各向异性数据集上的xy切片重建结果

方法	EPFL PSNR	EPFL SSIM	EPFL FSIM	FIB-25 PSNR	FIB-25 SSIM	FIB-25 FSIM
CycleGAN-IR	22.05	0.491	0.856	22.39	0.554	0.856
EMDiffuse†	23.34	0.519	0.899	24.10	0.514	0.878
IsoVEM	23.91	0.597	0.856	21.51	0.546	0.846
EMGauss	26.59	0.698	0.943	27.37	0.728	0.920

†EMDiffuse需要额外数据训练

Table 3: EPFL数据集上的下游分割结果（SAM2, IoU）

方法	CycleGAN-IR	EMDiffuse	EMGauss
IoU	0.9099	0.9555	0.9687

消融实验¶

Table 4: 关键组件消融（两个各向同性数据集平均）

配置	PSNR	SSIM	FSIM
去除Teacher-Student	25.19	0.627	0.904
去除预热阶段	25.76	0.653	0.908
去除联合训练	24.35	0.577	0.851
去除动态不透明度 \(\Delta o\)	25.44	0.630	0.894
添加动态旋转 \(\Delta R\)	25.07	0.640	0.906
完整模型	26.98	0.713	0.932

关键发现¶

EMGauss在PSNR上比最佳baseline高出 ~3dB（EPFL和FIB-25）
在xz/yz切片重建中，即使EMGauss仅用xy训练，效果仍优于用xz/yz训练的baseline
在真实各向异性FANC数据集（×10各向异性）上，EMGauss是唯一支持任意时间步连续生成的方法
三阶段训练中，联合训练阶段的去除影响最大（PSNR下降2.6）
动态不透明度比动态旋转更重要——静态不透明度无法建模结构的出现/消失，而动态旋转会引起时间抖动

亮点与洞察¶

问题转化的巧妙性：将切片重建转化为动态场景渲染，从根本上避免了各向同性假设
完全自包含：仅使用目标体积的各向异性切片进行优化，无需外部数据集或大规模预训练
连续生成能力：可在任意深度合成插值切片，这是基于离散帧插值方法无法实现的
高斯属性的精细控制：对哪些属性随时间变化、哪些固定做了仔细设计，体现了对问题本质的深入理解

局限性 / 可改进方向¶

在噪声较大的输入切片中，高斯基元数量可能显著增长，导致内存消耗过大
可以在重建流水线前加入轻量去噪模块来稳定优化
未来可探索自适应高斯剪枝或与图像空间正则化器的联合学习
当前实验仅在电子显微镜领域验证，跨模态泛化能力有待证明

评分¶

新颖性: ⭐⭐⭐⭐⭐ — 问题转化思路独到，3DGS在医学成像中的创新应用
实验充分度: ⭐⭐⭐⭐ — 多数据集多指标验证，含下游任务和消融，但跨模态实验缺乏
写作质量: ⭐⭐⭐⭐ — 结构清晰，动机阐述充分
价值: ⭐⭐⭐⭐ — 提供了通用的slice-to-3D重建框架，超越vEM领域