Neural Field-Based 3D Surface Reconstruction of Microstructures from Multi-Detector Signals in Scanning Electron Microscopy¶

会议: CVPR 2026
arXiv: 2508.04728
代码: https://github.com/zju3dv/NFH-SEM
领域: 3D视觉
关键词: 扫描电子显微镜, 3D重建, 神经场, 微观结构, 光度立体

一句话总结¶

本文提出 NFH-SEM，一个基于神经场的混合框架，通过将 SEM 电子散射物理模型嵌入神经场优化过程，从多视角多检测器 SEM 图像重建高保真的微观结构 3D 表面，实现了自标定、抗阴影的纳米级精度重建（478nm 层叠特征、782nm 花粉纹理、1.559μm 断裂台阶）。

研究背景与动机¶

领域现状：扫描电子显微镜（SEM）是材料科学、生物学和工业制造中广泛使用的成像工具，能产生高分辨率的微/纳米尺度图像。但 SEM 图像本质上只是二次电子（SE）或背散射电子（BSE）的 2D 强度分布，不直接包含 3D 信息。现有 SEM 3D 重建方法主要分为：多视角方法（SfM+MVS）和单视角方法（光度立体 PS）。
现有痛点：
- 多视角方法在微观样品常见的弱纹理或重复图案区域容易失败
- 单视角 PS 方法需要使用参考样品进行检测器标定，且对阴影伪影高度敏感——阴影区域导致梯度估计失真
- 混合方法虽结合两者优势，但仍受限于标定需求、阴影问题，且使用 2D 高度图表示无法捕获复杂微观结构
- 基于学习的方法（NeuS、3DGS、前馈重建）要么缺少大规模 SEM 训练数据无法泛化，要么基于 RGB 光学渲染模型无法捕捉 SEM 信号中的几何线索
核心矛盾：SEM 的信号生成物理（电子散射）与常规 RGB 成像完全不同，但现有 3D 重建方法要么忽略 SEM 物理（多视角方法）、要么依赖简化物理模型且需复杂标定（单视角方法）。
本文目标 设计一个能自动学习 SEM 成像物理、自标定检测器参数、自动分离阴影区域的神经场重建框架。
切入角度：将 BSE 信号的散射和检测器响应建模为可学习的前向模型，嵌入到 SDF 神经场的体渲染管线中，与几何共同优化。
核心 idea：通过将可学习的 BSE 前向模型嵌入神经场优化，实现 SEM 成像物理的自标定和阴影自动分离，从而获得高保真微观 3D 重建。

方法详解¶

整体框架¶

输入为多视角、多检测器 SEM 图像（每个视角一张 SE 图 + 四张 4Q-BSE 图）。流程分两阶段：(1) 用多视角 SE 图像进行 SfM+MVS 获得粗糙初始几何和相机参数；(2) 以粗糙几何为初始化，通过 SDF 神经场融合多视角深度先验和 4Q-BSE 光度信息，联合优化几何和 BSE 前向模型参数。输出为高保真 3D 表面 mesh。

关键设计¶

可学习的 BSE 前向模型（Learnable BSE Forward Model）:
- 功能：将预测的表面法线映射为 4Q-BSE 强度，使 BSE 图像能直接监督神经场的几何学习
- 核心思路：传统 PS 方法使用 \(I_i(n) = d_i \cos(\varphi_i - \varphi_n)\tan(\theta_n) + c_i\) 直接从 BSE 图像计算梯度，需要标定 \(c/d\)。NFH-SEM 反其道——用一个包含 16 个可学习参数的前向模型 \(\mathcal{F}_i(n) = \mathbf{R}(\theta_n)[d_i\cos(\varphi_i-\varphi_n)\sin(\theta_n) + c_i\cos(\theta_n)] + e_i\) 将法线映射为 BSE 强度，其中发射放大项 \(\mathbf{R}(\theta)\) 用四阶多项式替代传统的 \(\sec(\theta)\) 以更好拟合真实 BSE 响应。4 个象限有独立的 \(c, d, e\) 参数和共享的多项式系数 \(p\)
- 设计动机：(1) 传统解析模型不够精确（消融实验证实）；(2) 通过可学习方式实现自标定，无需参考样品；(3) 前向模型嵌入体渲染可将梯度信息有效传导到神经场
迭代阴影分离策略（Iterative Shadow Separation）:
- 功能：自动检测并排除 BSE 图像中的阴影区域，避免阴影污染几何重建
- 核心思路：观察到前向模型输出 \(\mathcal{F}(\hat{n};\hat{\Phi})\) 与实际 BSE 图像 \(b\) 之间的大偏差主要出现在阴影区域（因为阴影不能被表面法线函数建模）。据此定义动态二值阴影掩码 \(S = (|\mathcal{F}(\hat{n};\hat{\Phi}) - b| < \alpha d)\)，阈值 \(\alpha d\) 随训练中的参数 \(d\) 动态更新——\(d\) 控制 BSE 强度对法线的敏感度，因此按比例设阈值可防止将几何引起的强度变化误分类为阴影
- 设计动机：阴影在 4Q-BSE 图像中普遍存在，直接用含阴影的图像监督会导致几何严重失真。迭代分离形成正反馈——更好的阴影掩码 → 更干净的监督 → 更准确的几何和前向模型 → 更好的阴影检测
三阶段训练策略:
- 功能：稳定地将多源几何线索融合到神经场中
- 核心思路：Stage I：仅用深度损失 \(\mathcal{L}_d\) 和 SDF 正则化 \(\mathcal{R}_s\) 初始化粗糙几何先验。Stage II：加入 BSE 损失 \(\mathcal{L}_{BSE}(1)\)（不含阴影掩码）和前向模型正则化 \(\mathcal{R}_\Phi\)，联合学习法线-BSE 映射关系。Stage III：激活动态阴影掩码 \(\mathcal{L}_{BSE}(S)\)，精化几何和模型。每阶段仅 1000 迭代，总训练约 2 分钟
- 设计动机：直接联合优化所有组件会不稳定；先建立几何先验再逐步引入光度信息和阴影处理
BSE 前向模型正则化:
- 功能：约束 4 个象限参数不要过度偏离
- 核心思路：对 \(c, d, e\) 三组参数分别计算方差并作为正则项 \(\mathcal{R}_\Phi = \text{Var}(c) + \text{Var}(d) + \text{Var}(e)\)，鼓励象限一致性同时允许制造误差导致的小差异
- 设计动机：BSE 检测器 4 个象限本质上是对称设计，参数应接近，但实际存在制造和安装公差

损失函数¶

总损失 \(\mathcal{L} = \lambda_1 \mathcal{L}_d + \lambda_2 \mathcal{R}_s + \lambda_3 \mathcal{L}_{BSE} + \lambda_4 \mathcal{R}_\Phi\)，其中 \(\mathcal{L}_d\) 为加权深度损失（用 MVS 置信度加权），\(\mathcal{R}_s\) 为标准 SDF 梯度单位范数约束，\(\mathcal{L}_{BSE}\) 为 4Q-BSE 图像的 MAE 损失。

实验关键数据¶

主实验（真实数据集定性对比）¶

在 TPL 微结构（Wukong、Lucy、Lion）、桃花花粉和碳化硅颗粒上： - 多视角基线仅获得粗糙形状，无法恢复光滑基面和细节（如发丝、层叠台阶、花粉纹理） - 单视角 PS 基线恢复有限纹理但全局形变严重 - 6 种学习方法（NeuS、2DGS、PGSR、DN-Splatter、VGGT、MapAnything）直接应用均严重失败 - NFH-SEM 精确恢复了 478nm 打印分层（Lucy 样品）、782nm 花粉粘附纹理、1.559μm 断裂台阶

消融实验（模拟数据集，单位 nm）¶

配置	Chamfer ↓	法线角度误差 ↓	BSE 模型误差 ↓
输入粗糙模型	25.11	7.85°	-
单视角 PS	512.22	12.99°	-
w/o BSE-\(\mathcal{F}\)（直接梯度监督）	135.61	7.48°	-
w/o Poly-\(\mathbf{R}\)（简化发射模型）	19.96	4.34°	7.16
w/o 4Q-Var（共享象限参数）	19.90	3.91°	1.35
w/o S-Mask（无阴影掩码）	29.38	4.36°	0.61
完整模型	17.48	3.70°	0.27

关键发现¶

可学习前向模型是最关键组件——直接用梯度监督（w/o BSE-\(\mathcal{F}\)）Chamfer 距离恶化 7.75 倍
多项式发射项（Poly-\(\mathbf{R}\)）相比简化 \(\sec(\theta)\) 将 BSE 建模误差从 7.16 降至 0.27
阴影掩码消除后 Chamfer 距离从 17.48 增至 29.38，证明阴影分离对几何精度至关重要
阴影检测平均准确率达 81.7%
整个训练仅需约 2 分钟（单 RTX 4090），3000 迭代

亮点与洞察¶

物理模型嵌入神经场的范式：不是直接用物理公式计算梯度去监督，而是将物理模型作为可微分层嵌入优化——这个思路可以推广到其他需要专用成像物理的领域（如 X 射线、超声波）
自标定的优雅实现：通过将检测器参数作为可学习变量联合优化，免去了传统方法需要参考样品标定的繁琐流程，大大降低了使用门槛
迭代阴影分离的正反馈机制：利用前向模型残差定义阴影掩码，并按物理参数 \(d\) 自适应调整阈值，形成自增强循环——是一个非常巧妙的工程设计

局限与展望¶

假设均质的电子发射系数——对多材料混合样品可能不成立
极端遮挡的微孔结构可能所有象限都被阴影覆盖，无法恢复信息
低导电性样品的充电效应导致像素漂移，可能影响多视角对齐
数据集虽然开创性但规模有限（仅 3 类样品）
可扩展：支持异质材料的分段发射系数估计、更多样品类型的验证

评分¶

新颖性: ⭐⭐⭐⭐⭐ 首次将神经场方法完整适配到 SEM 成像物理，自标定和阴影分离策略设计精巧
实验充分度: ⭐⭐⭐⭐ 真实和模拟数据均有评估，消融全面，但真实数据缺乏定量 GT 对比
写作质量: ⭐⭐⭐⭐⭐ SEM 物理背景介绍清晰，方法推导严谨，图示精美
价值: ⭐⭐⭐⭐⭐ 对材料科学和生物学的微观 3D 表征有重要应用价值，开创了 SEM + 神经场交叉领域