Learning Neural Exposure Fields for View Synthesis¶

会议: NeurIPS 2025
arXiv: 2510.08279
代码: https://m-niemeyer.github.io/nexf
领域: 3D 视觉 / 视图合成
关键词: 神经辐射场, 视图合成, 曝光补偿, 3D 一致性, 高动态范围

一句话总结¶

提出神经曝光场（NExF），通过学习每个 3D 点的最优曝光值（而非每张图像的曝光），实现 3D 一致的高质量视图合成，在高动态范围场景中相比 SOTA 方法 PSNR 提升 3.5+，速度快 50 倍。

领域现状：标准 NeRF 基准排除了曝光变异，但真实场景（如室内外混合、有窗房间）常含强曝光变化，导致重建质量严重下降。

现有痛点：HDRNeRF 需要专业 HDR 软件后处理，且仅在 2D 图像层做色调映射，不同视图的同一 3D 点颜色不一致。GLO 嵌入对小曝光变化鲁棒但大变化时失效。

核心矛盾：传统相机为每张图像选一个曝光（2D 操作），而理想的方式是为每个 3D 点学习最优曝光（3D 操作）。

核心 idea：将曝光从 2D 图像级别提升到 3D 点级别，保证同一 3D 点在所有视图中颜色一致。

在标准 NeRF 架构上增加两个组件：(1) 潜在曝光条件化——在 NeRF 瓶颈层（而非输入层）注入 log 曝光；(2) 神经曝光场——一个额外的 MLP 学习 3D 空间中的最优曝光值。

潜在曝光条件化（Section 3.1）
- 功能：在 NeRF 的瓶颈层而非输入层做 log 曝光条件化
- 核心思路：\(f_\theta(\mathbf{x}, \mathbf{d}, \Delta t) = f_\theta^{view}(f_\theta^{pos}(\mathbf{x}) + \ln \Delta t(\mathbf{r}), \mathbf{d})\)，位置编码 \(f_\theta^{pos}\) 已预测 log 辐射度，直接在中间层加入曝光更稳定
- 设计动机：中间层条件化相比直接输入条件化性能提升 5%+，因为位置编码已经包含辐射度信息
神经曝光场（Section 3.2）
- 功能：学习 3D 曝光值的神经场 \(e_\phi: \mathbb{R}^3 \to \mathbb{R}\)
- 核心思路：全连接 MLP（4 层，维度 128），仅在颜色"好曝光且饱和"时更新曝光——好曝光权重 \(w_{exp}(\mathbf{c}) = \prod_i \exp(-(c_i - 1/2)^2/\sigma_{exp})\)；饱和度权重 \(w_{sat}(\mathbf{c}) = \sqrt{\frac{1}{3}\sum_i (c_i - \bar{\mu}_c)^2}\)
- 设计动机：3D 一致性由设计保证——同一 3D 点的曝光值与视角无关；3D 光滑约束 \(\|\Delta t_{diff}\|_2^2\) 保证相邻点曝光接近
联合优化（Section 3.3）
- 功能：端到端联合训练 NeRF 参数 \(\theta\) 和曝光场参数 \(\phi\)
- 核心思路：按像素权重有选择地反向传播——仅当颜色好曝光且饱和时更新曝光，忽略欠曝过曝像素
- 总损失：\(\mathcal{L}(\theta, \phi) = \mathcal{L}_f(\theta) + \mathcal{L}_e(\phi)\)

方法	推理时间	ID-PSNR↑	OOD-PSNR↑	ID-LPIPS↓
NeRF	405min	13.97	14.51	0.376
ZipNeRF	11min	19.00	19.73	0.142
NeRF-W	437min	29.83	29.22	0.047
HDRNeRF	542min	39.07	37.53	0.026
HDR-GS*	34min	41.10	36.33	0.011
NExF	11min	42.54	38.36	0.014

配置	PSNR(ID)	SSIM(ID)	LPIPS(ID)	说明
w/o 视角 MLP	33.85	0.928	0.104	基础 NeRF
w/o 潜在条件化	39.88	0.979	0.038	直接条件化
完整 NExF	42.54	0.988	0.014	最优