EF-3DGS: Event-Aided Free-Trajectory 3D Gaussian Splatting¶
会议: NeurIPS 2025 arXiv: 2410.15392 代码: 待确认 领域: 3d_vision 关键词: event camera, 3D Gaussian Splatting, free-trajectory, pose estimation, novel view synthesis
一句话总结¶
EF-3DGS 首次将事件相机引入自由轨迹场景重建,通过事件生成模型(EGM)重建帧间潜在图像做连续监督、对比度最大化(CMax)结合线性事件模型(LEGM)挖掘运动信息校准位姿,以及光度 BA + Fixed-GS 策略解决颜色不一致问题,在高速场景下 PSNR 提升 3dB、ATE 降低 40%。
背景与动机¶
- 3DGS 从带位姿的图像集合优化场景表示,在新视角合成取得巨大进展
- 自由轨迹视频重建面临两大挑战:(1) 位姿不准确,(2) 高速场景下帧间重叠不足导致欠约束
- 已有 pose-free 方法(LocalRF, CF-3DGS)在高速/低帧率场景性能严重退化
- 事件相机具备高时间分辨率和低延迟,能在帧间盲区提供丰富的亮度和运动信息
- 将事件数据无缝集成到 3DGS 存在技术难点:事件是差分信号 vs 3DGS 渲染绝对亮度
核心问题¶
如何利用事件相机的高时间分辨率特性,在高速自由轨迹场景中同时优化相机位姿和 3DGS 场景重建质量?
方法详解¶
1. EGM 驱动优化¶
将帧间时间区间均分为 N 个子区间,累积事件帧。利用最近帧和累积事件重建中间时刻的潜在亮度图:
以此为监督信号,将 3DGS 优化从离散帧拓展到连续事件流:
2. CMax + LEGM 联合优化¶
CMax 框架利用事件的时空关联估计运动场。将前 r 个子区间的事件帧通过光流 warp 回参考帧,光流由 3DGS 渲染深度和相对位姿推算。
对比度最大化损失:最大化 warped 事件图像(IPWE)的方差:
LEGM 梯度损失基于线性事件模型建立 IPWE 与渲染图像亮度变化的联系:
3. 光度 BA + Fixed-GS 策略¶
PBA 对随机采样时刻建立光度重投影误差,将渲染像素投影到最近 RGB 帧计算一致性。
Fixed-GS 两阶段策略: - 第一阶段:全参数优化(位置、透明度、旋转、缩放、SH),使用事件+帧损失 - 第二阶段:仅优化 SH 系数(颜色),其余参数固定,仅在 RGB 帧上训练
两阶段比例 4:1,有效解决事件流无色彩信息导致的颜色失真。
总损失¶
实验关键数据¶
Tanks and Temples 基准(不同帧率)¶
| 方法 | Pose-Free | 6FPS PSNR↑ | 2FPS PSNR↑ | 1FPS PSNR↑ |
|---|---|---|---|---|
| CF-3DGS | Yes | 26.05 | 22.08 | 20.53 |
| Event-3DGS (E+F) | No | 26.32 | 23.44 | 22.41 |
| EvCF-3DGS | Yes | 26.07 | 22.81 | 21.73 |
| EF-3DGS | Yes | 26.66 | 24.43 | 23.96 |
在 1FPS 极端高速场景下 EF-3DGS 比 CF-3DGS 高 3.43dB。
位姿估计¶
EF-3DGS 在所有帧率下 ATE 均为最低,高速场景降幅约 40%。在新采集的 RealEv-DAVIS 真实事件数据集上同样显著领先。
亮点¶
- 首次将事件相机引入自由轨迹 3DGS 场景重建任务
- 从事件相机成像原理出发推导三个互补损失函数(EGM/CMax+LEGM/PBA),设计严谨
- Fixed-GS 两阶段训练策略巧妙分离结构和颜色优化,解决事件流无颜色信息的核心矛盾
- 高速场景(1FPS)PSNR 提升 3dB 以上,实用意义显著
局限性 / 可改进方向¶
- 需要事件+帧同步的硬件(DAVIS 相机),实际部署成本较高
- 事件噪声模型较简化(固定对比度阈值 C),真实场景噪声更复杂
- 渐进式场景扩展继承自 LocalRF/CF-3DGS,超长序列效率待验证
- 动态场景处理能力未明确讨论
与相关工作的对比¶
- vs CF-3DGS: 纯帧方法,高速场景严重退化;EF-3DGS 通过事件流补充帧间信息
- vs Event-3DGS: 需要已知位姿;EF-3DGS 是 pose-free 的
- vs E-NeRF/EventNeRF: 基于 NeRF 的事件方法,需已知位姿且限于小场景
- vs EvCF-3DGS: 简单将事件损失加入 CF-3DGS,缺少 CMax 运动约束和 Fixed-GS 策略
启发与关联¶
- CMax 框架在 3DGS 中的应用思路可拓展到其他需要亚帧级运动估计的任务
- Fixed-GS 两阶段训练策略可推广到其他多模态(如热红外+可见光)场景建模
- 事件相机在 VR/AR、FPV 无人机、自动驾驶等高速场景有天然优势
评分¶
- ⭐ 新颖性: 4.5/5 — 首创事件辅助自由轨迹 3DGS,三个损失函数设计精巧
- ⭐ 实验充分度: 4/5 — 公开基准+自建真实数据集,多帧率全面对比
- ⭐ 写作质量: 4/5 — 方法从事件成像原理推导,逻辑清晰
- ⭐ 价值: 4.5/5 — 高速场景重建痛点的有效解决方案