跳转至

AAA-Gaussians: Anti-Aliased and Artifact-Free 3D Gaussian Rendering

会议: ICCV 2025
arXiv: 2504.12811
代码: GitHub (有)
领域: 3D视觉 / 新视角合成 / 实时渲染
关键词: 3D Gaussian Splatting, 抗锯齿, 无伪影渲染, 视锥剔除, 视角一致性

一句话总结

通过在3DGS渲染管线的所有环节中融入完整的3D评估(而非2D splat近似),提出自适应3D平滑滤波器、视空间边界计算和基于视锥的tile剔除,统一解决了3DGS中的锯齿、投影伪影和弹出伪影(popping),在OOD视角下大幅优于现有方法,同时保持实时渲染(>100 FPS)。

背景与动机

3DGS通过将3D Gaussian投影为2D splat实现高效渲染,但这个近似引入了多种伪影:(1)仿射投影近似导致广角/边缘处的畸变伪影;(2)缩放变化时缺乏抗锯齿导致的锯齿伪影;(3)Gaussian延伸到视锥外时的弹出伪影;(4)全局排序导致的视图不一致。现有方法各自只解决其中一两个问题,且在OOD视角下仍会失败。

核心问题

如何在保持光栅化效率的同时,通过完整的3D Gaussian评估统一解决所有类型的渲染伪影?核心挑战:2D抗锯齿方法(如Mip-Splatting的屏幕空间Mip滤波器)无法直接用于3D评估。

方法详解

整体框架

基于StopThePop的层级光栅化器,将bounding、culling、深度评估、贡献估计和抗锯齿全部替换为3D感知的实现。使用MCMC密化策略。渲染流程:3D bounding(视空间角度)→ 3D frustum culling → 逐像素3D Gaussian评估 → 层级排序混合。

关键设计

  1. 自适应3D平滑滤波器(Adaptive 3D Smoothing Filter): 替代Mip-Splatting的2D屏幕空间Mip滤波器。关键发现:直接用3D体积变化作为振幅缩放会导致高度各向异性Gaussian过度透明。创新地只考虑垂直于观察光线方向的面积变化来调整振幅(而非体积变化)。通过Schur补和Hartley分析推导出高效的封闭形式解(Eq.10-12),避免矩阵求逆。结合训练时最大采样频率\(\hat{v}_{train}\)和当前渲染频率\(\hat{v}\)的自适应切换。

  2. 视空间透视正确边界(View-Space Bounding): 不在屏幕空间而在视空间计算Gaussian的边界。通过对椭球体进行平面拟合,求解角度\(\theta_{1,2}\)\(\phi_{1,2}\)(Eq.14-15)。当Gaussian延伸到图像平面后方时,屏幕空间方法会失败(导致弹出),而视空间角度计算天然稳定。计算后再通过角度到屏幕坐标的转换得到tile分配。

  3. 基于视锥的3D Tile剔除(Frustum-Based Culling): 将StopThePop的2D tile剔除提升到3D。对每个tile构建4平面视锥\(\mathcal{F}\),在Gaussian标准化空间中寻找视锥内的最大贡献点,判断\(\rho(\mathbf{x})^2 < \tau_\rho\)。优化实现:只投影最近的2个平面+3条边(而非4个平面+4条边),关键性能优化。

损失函数 / 训练策略

  • 标准3DGS训练目标(L1 + SSIM),使用MCMC密化
  • 滤波器参数\(k=0.3\)(与Mip-Splatting一致)
  • 截断阈值\(\tau_\rho\)用于边界和剔除计算

实验关键数据

标准数据集(分布内视角)

方法 Mip-NeRF360 PSNR T&T PSNR Deep Blending PSNR
3DGS 27.443 23.734 29.510
StopThePop 27.304 23.226 29.929
Mip-Splatting 27.540 23.821 29.660
MCMC 28.027 24.642 29.727
本文 27.835 23.582 30.485

大视场评估(3×FOV,OOD)

方法 Mip-NeRF360 PSNR T&T PSNR
3DGS 17.112 -
MCMC 14.369 -
Taming 3DGS 11.545 -
本文 23.583 -

OOD场景质量提升极其显著:3×FOV下PSNR从MCMC的14.369到本文的23.583(+9.2 dB)

多分辨率评估(Bicycle场景)

分辨率 MCMC PSNR 本文 PSNR 本文w/o AA PSNR
1/2× 21.15 26.73 20.99
28.98 32.12 28.54
25.69 25.74 25.65

渲染性能(RTX 4090, ms/帧)

方法 Mip-NeRF360 T&T
本文 7.72 5.81
MCMC 6.79 4.43
本文 w/o culling 14.40 8.88

消融实验要点

  • 去掉层级排序:分布内PSNR略微提升(过拟合),但产生严重的popping伪影
  • 去掉AA:分布内影响小,但低/高分辨率下质量大幅下降
  • 去掉3D评估:产生FOV增大时的投影畸变
  • 去掉frustum culling:性能大幅下降(7.72→14.40 ms),但不影响质量
  • 各组件互补:只有全部结合才能实现无伪影渲染

亮点

  • 垂直面积 vs 体积的振幅缩放: 3D滤波器的关键洞察——沿光线方向的尺度变化不应影响振幅,只有垂直于光线的面积变化才重要。数学推导优雅(Schur补)
  • 视空间角度代替屏幕空间坐标: 从根本上避免了Gaussian跨越近平面时的不稳定性,是正确处理边界的方式
  • 统一解决所有伪影: 首个在单一框架中解决锯齿+投影畸变+popping+剔除的光栅化方法
  • OOD场景的价值: 分布内指标差异不大,但OOD场景(大FOV、分辨率变化)才能真正体现方法的鲁棒性

局限性 / 可改进方向

  • 分布内评估指标改进有限(标准benchmark上与MCMC接近)
  • 视空间边界仍绑定针孔相机模型,不支持鱼眼等其他相机
  • 层级排序带来额外性能开销(vs 不排序快近2×,但有popping)
  • 视图一致性更强意味着更少的过拟合空间,可能需要更强的视角依赖编码(如更高阶SH)

与相关工作的对比

  • vs Mip-Splatting: 共同关注抗锯齿,但Mip-Splatting在2D屏幕空间操作,无法支持3D评估;本文的3D滤波器在OOD视角下鲁棒性大幅提升
  • vs StopThePop: 共享层级排序框架,但StopThePop仍用2D边界和2D剔除,本文将所有操作提升到3D
  • vs Hybrid Transparency(Hahlbohm et al.): 都做3D评估和精确边界,但HT在边缘处仍有pop-in(丢弃越界Gaussian),本文通过视空间边界彻底解决

启发与关联

  • 与多尺度光照场idea的关联ideas/3d_vision/20260317_multiscale_illumination_field_3dgs.md):本文发现更强的视角一致性约束下view-dependent效果表达不足,恰好印证了更强视角依赖编码(如张量分解光照场)的必要性——AAA-Gaussians提供无伪影的几何基座,多尺度光照场可作为外观增强模块
  • 对3DGS编辑/安全工作的启示ideas/3d_vision/20260317_graph_autoregressive_3dgs_edit.md):无伪影的渲染基座是3DGS下游应用(编辑、安全、压缩)的基础需求,本文可直接作为底层renderer
  • 3DGS渲染质量改进是3D视觉基础设施级贡献,视空间操作思路对VR/大FOV场景重要
  • 潜在方向:将自适应3D滤波器的"垂直于射线的正交分解"思想迁移到其他3D表示的LOD/anti-aliasing

评分

  • 新颖性: ⭐⭐⭐⭐ 3D AA滤波器的振幅缩放推导新颖,视空间边界计算巧妙
  • 实验充分度: ⭐⭐⭐⭐⭐ 全面的分布内/OOD评估、详尽消融、多数据集多场景、性能计时
  • 写作质量: ⭐⭐⭐⭐⭐ 数学推导严谨,问题分析透彻,图示清晰
  • 价值: ⭐⭐⭐⭐ 对3DGS渲染质量和鲁棒性的实质性提升,代码开源,是3DGS渲染管线的重要参考实现