LR-SGS: Robust LiDAR-Reflectance-Guided Salient Gaussian Splatting for Self-Driving Scene Reconstruction¶
会议: CVPR 2026 arXiv: 2603.12647 代码: 待确认 领域: 自动驾驶 关键词: 3D Gaussian Splatting, LiDAR反射率, 自动驾驶场景重建, 新视角合成, 多模态融合
一句话总结¶
LR-SGS 提出利用 LiDAR 反射率引导的结构感知 Salient Gaussian 表示,通过将 LiDAR 强度校准为光照不变的反射率通道附加到每个 Gaussian、从几何与反射率特征点初始化结构化 Salient Gaussian、以及 RGB-反射率跨模态梯度一致性约束,在 Waymo 数据集的复杂光照场景中以更少 Gaussian 数量和更短训练时间超越 OmniRe 达 1.18 dB PSNR。
研究背景与动机¶
-
领域现状:3DGS 在自驾场景重建和新视角合成中展示了快速高保真渲染能力。现有方法如 StreetGS、OmniRe 等已构建动态场景图来处理时序动态物体。
-
现有痛点:纯相机方法在复杂光照(夜间、逆光)和大幅自车运动下易出现纹理不一致和优化不稳定。现有 LiDAR-增强方法(如 PVG、OmniRe)仅用点云做 Gaussian 初始化或深度监督,未充分挖掘 LiDAR 点云中的反射率信息和几何结构信息。
-
核心矛盾:RGB 信号对光照、曝光等外部因素敏感,无法在弱纹理区域和材质边界处提供可靠约束;LiDAR 虽提供精确深度且对光照不敏感,但其反射强度(intensity)中蕴含的材质属性(reflectance)和几何结构特征尚未被有效利用。
-
本文要解决什么:(1) 如何将 LiDAR 的光照不变材质信息融入 Gaussian 表示?(2) 如何用结构感知的 Gaussian 更精确地建模边缘和平面?(3) 如何跨模态对齐 RGB 与反射率的边界?
-
切入角度:LiDAR 原始返回信号包含 intensity,经距离 \(R\) 和入射角 \(\alpha\) 校正后可得到近似光照不变的 reflectance \(\rho\)。场景中的边缘、平面等关键结构可以从点云的平滑度和反射率梯度中提取——以此初始化一种参数更少但能精确表征结构的 Salient Gaussian。
-
核心 idea 一句话:用 LiDAR 校正反射率作为光照不变通道附加到 Gaussian,从几何和反射率特征点初始化结构感知 Salient Gaussian,并通过 RGB-反射率梯度对齐来增强材质边界一致性。
方法详解¶
整体框架¶
输入为 RGB 图像序列和 LiDAR 点云序列。方法构建一个 3DGS 场景图(背景、动态物体、天空节点),其中初始场景 Gaussian 由两部分组成:从 LiDAR 特征点初始化的 Salient Gaussian 和从 SfM 点初始化的 Non-Salient Gaussian。通过渲染得到彩色图、深度图和反射率图,使用 Color Loss + LiDAR Loss + Joint Loss 联合优化所有 Gaussian 的位置、不透明度、尺度、旋转、外观和反射率属性。
关键设计¶
1. LiDAR 强度校准 (LiDAR Intensity Calibration)¶
- 做什么:将 LiDAR 原始 intensity 校正为光照不变的反射率 \(\rho\)
- 核心思路:根据雷达方程 \(I = \eta_{all} \frac{\rho \cos\alpha}{R^2}\),用距离 \(R\) 和入射角 \(\alpha\) 对 intensity 进行归一化校正。入射角通过点 \(\mathbf{p}\) 与其邻域点 \(\mathbf{p}_1, \mathbf{p}_2\) 构建局部法向量 \(\mathbf{n}\) 来计算:\(\cos\alpha = \frac{\mathbf{p}^T \cdot \mathbf{n}}{\|\mathbf{p}\|}\)。校正后的反射率归一化到 \([0,1]\) 并投影到相机平面得到稀疏反射率图 \(F_{gt}\)
- 设计动机:原始 intensity 受距离和角度影响,不能直接作为材质属性。校正后的 reflectance 近似反映物体表面材质特性,不随光照变化,可作为稳定的跨帧约束信号
2. Salient Gaussian 结构感知表示¶
- 做什么:设计一种参数高效的结构化 Gaussian,分为 Edge 型(沿边缘拉长)和 Planar 型(沿平面压扁)
- 核心思路:每个 Salient Gaussian 具有一个主导方向 \(d_{spec}\) 和对应的主导尺度 \(\sigma_\|\),其余两轴共享一个尺度 \(\sigma_\perp\)。协方差矩阵简化为:Edge 型 \(\Sigma_{edge} = \mathbf{R} \operatorname{diag}(\sigma_\|^2, \sigma_\perp^2, \sigma_\perp^2) \mathbf{R}^T\),Planar 型 \(\Sigma_{plane} = \mathbf{R} \operatorname{diag}(\sigma_\perp^2, \sigma_\perp^2, \sigma_\|^2) \mathbf{R}^T\)
- 设计动机:普通 3DGS 每个 Gaussian 有 3 个独立尺度参数,而环境中大量边缘和平面结构只需沿特定方向拉伸/压扁即可表征。减少参数的同时更准确地匹配环境特征
3. LiDAR 特征点初始化¶
- 做什么:从 LiDAR 点云中提取三类特征点来初始化 Salient Gaussian
- 核心思路:(a) 计算每个点的平滑度 \(c_j = \frac{1}{|K| \cdot \|\mathbf{p}_j\|} \|\sum_{\mathbf{p}_i \in \mathcal{P}_j}(\mathbf{p}_i - \mathbf{p}_j)\|\),按阈值划分为 geometric edge points 和 geometric planar points;(b) 计算反射率梯度 \(G_j\)(沿同一环的左右邻域均值差),提取 reflectance edge points。三类特征点分别初始化 Edge/Planar Salient Gaussian
- 设计动机:与直接用全部 LiDAR 点初始化不同,特征点集中在结构关键位置(物体轮廓、道路边界、材质变化处),为训练提供稳定的结构脚手架,加速收敛
4. 改进密度控制与 Salient Transform¶
- 做什么:适配 Salient Gaussian 的分裂策略,并实现 Salient/Non-Salient 状态自适应切换
- 核心思路:分裂时,Edge Salient Gaussian 沿主导方向分裂,Planar 型在正交平面内分裂。定义 linearity \(L(g) = (s_1 - s_2)/s_1\) 和 planarity \(P(g) = (s_2 - s_3)/s_1\)。Non-Salient Gaussian 若连续两次 \(\max\{L, P\} > \tau_{max}=0.5\) 则升级为 Salient;Salient Gaussian 若连续两次 \(\max\{L, P\} < \tau_{min}=0.1\) 则降级为 Non-Salient
- 设计动机:训练过程中场景结构会动态变化,Salient Gaussian 需要能在 LiDAR 未覆盖区域自然生长,也需要排除不再具有明确方向性的冗余 Salient Gaussian
5. RGB-反射率跨模态一致性 (Joint Loss)¶
- 做什么:对齐渲染反射率与灰度 RGB 图像的梯度方向和幅度
- 核心思路:先将渲染 RGB 转为灰度 \(C^g\),与渲染反射率 \(F\) 分别做高斯平滑和 Scharr 梯度。Joint Loss 由两部分组成:方向一致性 \(\mathcal{L}_{dir} = 1 - \hat{\nabla}F \cdot \hat{\nabla}C^g\)(归一化梯度向量点积);幅度一致性 \(\mathcal{L}_{val} = \|g_F / F - g_{C^g} / C^g\|_1\)(归一化幅度 L1 差异,消除跨模态尺度差异)
- 设计动机:材质边界在 RGB 和反射率中都应表现为显著梯度,但两者的绝对尺度不同。通过对齐归一化梯度方向和幅度,可以在不引入尺度偏差的情况下锐化材质边界,减少模糊伪影
损失函数 / 训练策略¶
总损失 \(\mathcal{L} = \mathcal{L}_{rgb} + \mathcal{L}_{lidar} + \mathcal{L}_{joint}\),其中:
- \(\mathcal{L}_{rgb} = (1-\lambda_c)\mathcal{L}_1 + \lambda_c \mathcal{L}_{D\text{-}SSIM}\)(光度一致性)
- \(\mathcal{L}_{lidar} = \lambda_{depth}\mathcal{L}_{depth} + \lambda_{fle}\mathcal{L}_{fle} + \lambda'_{fle}\mathcal{L}'_{fle}\)(深度 + 反射率 + 反射率梯度)
- \(\mathcal{L}_{joint} = \lambda_{dir}\mathcal{L}_{dir} + \lambda_{val}\mathcal{L}_{val}\)(跨模态梯度对齐)
权重设置:\(\lambda_c = \lambda_{val} = 0.2\),\(\lambda_{depth} = \lambda_{fle} = \lambda_{dir} = 0.1\),\(\lambda'_{fle} = 0.05\)。训练 30k 迭代,Salient transform 阈值 \(\tau_{max}=0.5\),\(\tau_{min}=0.1\)。
实验关键数据¶
主实验¶
Waymo Open Dataset 上四类场景的新视角合成结果(PSNR/SSIM/LPIPS):
| 场景类型 | 指标 | LR-SGS (Ours) | OmniRe | StreetGS | 提升 |
|---|---|---|---|---|---|
| Dense Traffic | PSNR↑ | 28.89 | 28.44 | 27.01 | +0.45 |
| Dense Traffic | PSNR*↑ | 24.02 | 23.72 | 21.73 | +0.30 |
| High-Speed | PSNR↑ | 28.77 | 28.12 | 28.06 | +0.65 |
| Complex Lighting | PSNR↑ | 30.51 | 29.33 | 29.16 | +1.18 |
| Static | PSNR↑ | 28.73 | 28.23 | 28.15 | +0.50 |
在所有场景类别的 PSNR/SSIM/LPIPS 上全面领先。Complex Lighting 场景提升最为显著,达到 +1.18 dB PSNR。
消融实验¶
| 配置 | PSNR↑ | SSIM↑ | LPIPS↓ |
|---|---|---|---|
| Full model (Ours) | 29.22 | 0.850 | 0.139 |
| w/o Salient Gaussian | 28.74 | 0.830 | 0.152 |
| w/o LiDAR Feature Init | 28.94 | 0.839 | 0.144 |
| w/o Reflectance | 28.87 | 0.831 | 0.147 |
| w/o Joint Loss | 28.96 | 0.835 | 0.144 |
效率分析¶
| 方法 | PSNR↑ | Gaussian 数量↓ | 训练时间↓ | FPS↑ |
|---|---|---|---|---|
| StreetGS | 28.20 | 2,929,851 | 64m30s | 33.61 |
| OmniRe | 28.62 | 2,744,275 | 67m11s | 30.55 |
| LR-SGS | 28.95 | 2,510,883 | 59m25s | 36.95 |
关键发现¶
- Salient Gaussian 贡献最大:去掉后 PSNR 降 0.48 dB、LPIPS 增 0.013,说明结构感知表示对质量和效率都至关重要
- 反射率通道在复杂光照下效果显著:夜间场景中 LiDAR 反射率提供了 RGB 无法给出的稳定约束,有效抑制光照引起的伪影
- 效率优势明显:比 OmniRe 少约 23 万个 Gaussian、训练快 8 分钟、FPS 高 6.4,原因是 Salient Gaussian 的两参数减少了冗余并加速收敛
- Salient Transform 扩展覆盖:即使 LiDAR 未覆盖区域,Non-Salient Gaussian 也可通过 transform 升级为 Salient,确保全场景结构建模
- Joint Loss 既提升 RGB 质量又改善反射率渲染:车辆车牌、灯组等高频区域的重建清晰度显著改善
亮点与洞察¶
- LiDAR intensity → reflectance 的简单但有效校正:仅用距离和入射角做物理校正即可获得光照不变的材质表征,无需复杂的逆渲染或材质估计网络。这个思路可迁移到任何使用 LiDAR 的重建任务中
- 结构感知 Gaussian 的两参数化:用"主导方向 + 共享非主导尺度"替代三个独立尺度,实现了"更少参数 + 更好结构建模"的双赢,打破了精度与效率的常见 trade-off
- 跨模态梯度对齐而非像素对齐:直接对齐 RGB 和反射率的像素值缺乏物理意义(它们量纲不同),而对齐归一化梯度的方向和幅度巧妙绕过了尺度差异问题,聚焦于边界一致性
- Salient Transform 双向适应机制:类似于"晋升/降级"机制,让 Salient Gaussian 随训练过程自然确立和移除,避免了硬性分类带来的信息丢失
局限性 / 可改进方向¶
- 仅在 Waymo 数据集验证:未在 nuScenes、KITTI 等其他驾驶数据集上验证泛化性,不同 LiDAR 型号的 intensity 特性差异可能影响反射率校正效果
- 反射率校正依赖简化物理模型:实际中材质的 BRDF 远比 Lambert 反射复杂,校正精度在镜面反射、半透明材质等情况下可能不足
- 动态物体建模依赖外部 mask:物体掩码来自预训练模型,该环节的精度直接限制动态重建质量
- Salient Transform 阈值为手工设定:\(\tau_{max}=0.5\) 和 \(\tau_{min}=0.1\) 可能不适用于所有场景,自适应阈值策略值得探索