跳转至

PUP 3D-GS: Principled Uncertainty Pruning for 3D Gaussian Splatting

会议: CVPR 2025
arXiv: 2406.10219
代码: 项目页面
领域: 3D视觉 (3D Vision / Novel View Synthesis)
关键词: 3D高斯溅射, 模型剪枝, Fisher信息矩阵, 不确定性估计, 场景压缩

一句话总结

提出基于 Fisher 信息矩阵的有原则的 3D 高斯溅射剪枝方法 PUP 3D-GS,通过空间参数(位置+尺度)的二阶敏感度评分实现 90% 高斯剪枝率,同时保持比现有启发式方法更好的视觉质量和前景细节。

研究背景与动机

3D Gaussian Splatting (3D-GS) 在新视角合成中取得了巨大成功,实现了实时渲染和高重建质量。然而,复杂场景通常包含数百万个高斯,导致高存储和内存需求,限制了在资源受限设备上的部署。

现有的 3DGS 剪枝方法(如 LightGaussian、EAGLES、Compact-3DGS)依赖启发式标准来决定剪枝哪些高斯——例如基于不透明度、大小、透射率等的人工设计规则。这些启发式方法在高压缩率下(>80%)会严重损失视觉保真度,尤其是前景细节。

本文的核心洞察是:3D 场景重建是一个固有的欠约束问题——从有限视角拍摄的图像无法唯一确定每个高斯的 3D 位置和尺度(一个远处的大高斯和一个近处的小高斯在投影空间中可能等价)。这种空间不确定性可以通过 Fisher 信息矩阵来精确量化。不确定性高的高斯对场景重建贡献小,是优先剪枝的对象;不确定性低(敏感度高)的高斯对重建至关重要,应保留。

方法详解

整体框架

PUP 3D-GS 是一个后处理(post-hoc)剪枝流程,可应用于任何预训练 3D-GS 模型:(1)在收敛模型上计算每个高斯的空间敏感度评分;(2)移除评分最低的高斯;(3)对剩余高斯做微调(fine-tune);(4)可选地重复步骤 1-3 进行多轮剪枝。

关键设计

  1. 基于 Fisher 信息矩阵的敏感度评分:

    • 功能:为每个高斯计算一个有原则的重要性分数
    • 核心思路:从 \(L_2\) 重建误差出发,对高斯参数求二阶 Hessian。在收敛模型上残差项趋近零,Hessian 近似为 Fisher 信息矩阵 \(\nabla^2_\mathcal{G} L_2 \approx \sum_\phi \nabla_\mathcal{G} I_\mathcal{G}(\phi) \nabla_\mathcal{G} I_\mathcal{G}(\phi)^T\)。取块对角近似得到每个高斯的独立 Hessian \(\mathbf{H}_i\),最终敏感度评分为其对数行列式 \(U_i = \log|\nabla_{x_i, s_i} I_\mathcal{G} \nabla_{x_i, s_i} I_\mathcal{G}^T|\)。这个评分衡量扰动该高斯空间参数对重建误差的影响——值越高,高斯越重要
    • 设计动机:FisherRF 仅使用对角近似和颜色参数,不够准确;块对角近似+空间参数(位置+尺度)捕获了 3D 投影中的几何不变性
  2. 仅使用空间参数(位置+尺度):

    • 功能:将 Hessian 计算从全参数缩减到 6 维
    • 核心思路:经过消融实验发现,仅需 \(x_i \in \mathbb{R}^3\)(位置)和 \(s_i \in \mathbb{R}^3\)(尺度)即可获得有效的敏感度评分。旋转参数不需要,因为在投影不变性下旋转不会引起 3D 几何变化。颜色和球谐参数也可省略。最终每个高斯只需计算 \(6 \times 6\) 的块 Hessian
    • 设计动机:减少计算量的同时根据投影几何原理保留最有信息量的参数
  3. Patch-wise 计算 + 多轮剪枝流程:

    • 功能:降低计算开销并提升最终质量
    • 核心思路:(i)将图像降至 \(4\times4\) patch 分辨率计算 Fisher 近似,再在所有视角上求和得到场景级 Hessian——与逐像素计算高度相关但快得多。(ii)多轮剪枝:第一轮剪枝 88.5% 并微调 15K 迭代,第二轮在剩余中再剪枝 ~13% 并微调 15K 迭代,总计达到 90% 剪枝率。比等效的单轮 90% 剪枝质量更好
    • 设计动机:单轮大比例剪枝过于激进,多轮渐进式修剪让模型在每轮之间有机会重新适应

损失函数 / 训练策略

  • 剪枝后微调: 使用原始 3DGS 损失 \(L = \|I_\mathcal{G}(\phi) - I_{gt}\|_1 + L_{SSIM}(I_\mathcal{G}(\phi), I_{gt})\)
  • 无致密化: 微调阶段不进行高斯致密化,防止数量回升
  • 两轮流程: 第一轮保留 11.5%(15K 迭代微调) → 第二轮保留 10%(15K 迭代微调)

实验关键数据

主实验

Mip-NeRF 360 数据集(90% 剪枝率):

方法 PSNR↑ SSIM↑ LPIPS↓ 渲染 FPS↑
3D-GS (原始) 27.49 0.815 0.214 134
LightGaussian 25.30 0.756 0.280
PUP 3D-GS 26.56 0.792 0.230 477

Deep Blending 数据集示例(90% 剪枝):

场景 原始 GS 数 剪枝后 GS 数 原始 FPS 剪枝后 FPS 加速比
Playroom 2.65M 0.265M 76.65 318.06 4.15×

消融实验

参数选择 PSNR 说明
位置 + 尺度 (ours) 26.56 最佳,捕获投影不变性
全参数 26.41 增加旋转/颜色反而干扰评分
仅位置 26.32 缺少尺度信息
仅颜色 (如 FisherRF) 25.89 颜色不反映空间不确定性

关键发现

  • 90% 剪枝率下 PUP 3D-GS 在 PSNR 上领先 LightGaussian 约 1.26 dB
  • 平均渲染速度提升 3.56×,前景细节保留显著更好
  • 多轮剪枝比等效单轮剪枝提升约 0.3-0.5 dB
  • 可与 Vectree 量化等正交压缩技术结合使用

亮点与洞察

  • 从启发式到有原则的剪枝:利用 Fisher 信息矩阵(二阶优化理论)替代人工设计规则,提供了数学上的最优性保证——移除对重建误差影响最小的高斯。这种方法论的提升比单纯的性能提升更有价值
  • 空间参数的关键洞察:发现位置+尺度是最有效的剪枝参数(而非颜色),这与3D重建中投影几何不变性的直觉完美对应——不确定性主要来自深度方向的模糊性

局限与展望

  • Patch-wise 计算仍需遍历所有训练视角,在大规模场景上计算量较大
  • 剪枝后微调需要额外的 15K-30K 迭代训练
  • 未探索与自适应致密化策略的联合优化
  • 多轮剪枝的最优轮次和比例需要手动选择

相关工作与启发

  • vs LightGaussian: LightGaussian 使用全局显著性分数(启发式组合不透明度、覆盖范围等),在高压缩率下严重丢失前景细节;PUP 3D-GS 的 Fisher 评分更有原则且效果更好
  • vs FisherRF: FisherRF 也计算 Fisher 信息但仅用对角近似和颜色参数做主动视角选择;PUP 3D-GS 使用块对角近似和空间参数做剪枝,方法和目标都不同
  • vs BayesRays: BayesRays 在 NeRF 上用 Fisher 信息做不确定性量化,需要假设性扰动场;PUP 3D-GS 在 3DGS 上直接计算且更高效

评分

  • 新颖性: ⭐⭐⭐⭐ 将二阶优化理论引入 3DGS 剪枝,方法有原则性
  • 实验充分度: ⭐⭐⭐⭐ 三个数据集多压缩率评估,详细的参数选择消融
  • 写作质量: ⭐⭐⭐⭐ 数学推导清晰,从不确定性到剪枝的逻辑自然
  • 价值: ⭐⭐⭐⭐ 90%剪枝+更好质量,实用价值高,可与其他压缩技术正交使用

相关论文