Gaussian Blending: Rethinking Alpha Blending in 3D Gaussian Splatting¶

会议: AAAI 2026
arXiv: 2511.15102
代码: 待公开
领域: 3D视觉
关键词: 3D Gaussian Splatting, Alpha Blending, 抗锯齿, 多尺度渲染, 像素内空间分布

一句话总结¶

重新审视3DGS中的标量alpha blending，指出其忽略像素内空间变化是多尺度渲染伪影（放大erosion/缩小dilation）的根源，提出Gaussian Blending——将alpha和transmittance建模为像素内的空间分布（2D uniform window），实现实时抗锯齿且无需重训练，在多尺度Blender上PSNR从31.59→35.80。

研究背景与动机¶

领域现状：3DGS通过Gaussian splat显式表示3D场景，比NeRF渲染速度快数个量级，已成为Novel View Synthesis (NVS) 的主流方法。Mip-Splatting、Analytic-Splatting等方法通过预滤波改善了多尺度抗锯齿。
现有痛点：所有现有NVS方法在训练时未见过的采样率下仍有明显伪影——放大时出现边缘erosion（模糊），缩小时出现dilation（阶梯状伪影）。即使Analytic-Splatting做了解析积分，问题依然存在。
核心矛盾：所有方法都使用标量alpha blending——将alpha和transmittance作为标量（每像素一个值）计算。这导致前景splat会完全遮挡本不应被遮挡的背景splat，因为忽略了像素内的空间遮挡关系。当采样率变化时，这种误差被放大。
本文要解决什么？ 在不牺牲实时性能的前提下，将像素内的空间变化纳入alpha blending过程，消除erosion和dilation伪影。
切入角度：观察到Gaussian splat在2D screen space上形成连续表面，其合并后的transmittance可以用简单的2D uniform distribution近似。通过动态追踪这个distribution的window范围，就能高效建模空间遮挡。
核心idea一句话：将标量alpha blending替换为空间分布alpha blending——transmittance不再是一个数，而是像素内的一个spatial window

方法详解¶

整体框架¶

Gaussian Blending在3DGS原始pipeline中替换渲染kernel： - 输入：与3DGS相同的Gaussian splat场景表示 - 改进点：alpha blending阶段，将标量transmittance \(T_i\) 替换为2D uniform distribution表示（中心 \(x_i\)、尺寸 \(l_i\)、值 \(t_i\)） - 输出：更准确的像素颜色，特别是在训练时未见过的采样率下

关键设计¶

空间Transmittance Distribution:
做什么：用2D uniform window追踪像素内transmittance的空间分布
核心思路：传统方法中 \(T_i = \prod_{j=1}^{i-1}(1-\alpha_j(p))\) 是标量；Gaussian Blending将其表示为window \((x_i, l_i, t_i)\)，初始为整个像素区域（\(x_1=p, l_1=[1,1]^\top, t_1=1\)）。每渲染一个splat后，window会根据该splat的空间覆盖而收缩——被遮挡区域的transmittance降低，未被遮挡区域保持高transmittance
设计动机：物理上正确的渲染需要对像素区域积分 \(C_p^p = \int_p \sum_i T_i^p(x)\alpha_i(x)c_i dx\)，但直接计算是指数复杂度。观察到Gaussian splat聚集形成连续表面，合并后的transmittance近似uniform分布，因此用window近似即可
Weight计算（Splat响应积分）:
做什么：计算当前splat在transmittance window内的积分响应
核心思路：对2D Gaussian做特征值分解找到主轴，将window旋转对齐主轴，然后分解为两个独立的1D Gaussian积分：\(\int w_i(x)dx = t_i \cdot o_i \cdot I^0_{\sigma_1}(u_1,u_2) \cdot I^0_{\sigma_2}(v_1,v_2)\)，其中 \(I^k_\sigma(a,b)\) 是1D Gaussian的 \(k\) 阶矩
设计动机：直接2D积分无closed-form，利用特征值分解+旋转对齐可分解为可解析计算的1D积分
Window更新（Transmittance分布演化）:
做什么：渲染每个splat后更新spatial window
核心思路：利用1阶和2阶矩来匹配更新后的transmittance分布。新window的中心和大小通过矩匹配计算，确保remaining transmittance的空间分布被准确追踪。window会逐渐收缩到尚未被遮挡的区域
设计动机：高transmittance区域应保持对背景splat的可见性，低transmittance区域应抑制重复渲染

损失函数 / 训练策略¶

Training-free：Gaussian Blending是纯渲染方法，不需要额外训练
Drop-in replacement：可直接替换现有3DGS方法的渲染kernel
通过优化CUDA实现保持实时渲染速度，无额外内存开销
也提供 \(\text{GB}_\text{test}\) 变体：仅在test时应用Gaussian Blending

实验关键数据¶

主实验¶

Multi-scale Blender数据集（×1训练，×1/2~×1/8测试）的PSNR结果：

方法	×1	×1/2	×1/4	×1/8	Avg.
3DGS	33.57	27.04	21.43	17.74	24.95
Mip-Splatting	33.54	34.09	31.50	27.80	31.73
Analytic-Splatting	33.78	34.20	31.16	27.22	31.59
Gaussian Blending	33.92	35.80	36.82	35.79	35.58
Analytic+GB_test	33.62	35.72	37.36	36.51	35.80

×1/8缩小时：3DGS的17.74 → Gaussian Blending的35.79，提升18dB！

消融实验¶

配置	效果	说明
标量alpha blending	基线	erosion+dilation伪影
Structured pruning (不用window)	稍有改善	不追踪空间分布
Gaussian Blending (full)	最优	动态window追踪
仅test时应用GB	接近full	无需重训练也有效

关键发现¶

标量alpha blending是多尺度伪影的根源——不是prefiltering不够，而是blending本身有问题。即使Analytic-Splatting做了完美的像素积分，标量transmittance仍然导致边缘伪影
在未见尺度上提升巨大（×1/4: +5.7dB, ×1/8: +8.6dB vs Analytic-Splatting），同时在训练尺度（×1）上也略有提升
与现有方法正交互补：可叠加在Mip-Splatting或Analytic-Splatting上进一步提升
保持实时渲染速度，无额外内存开销

亮点与洞察¶

问题诊断精准：不是提出新的抗锯齿滤波器，而是从"blending本身是错的"这个角度切入，找到了所有NVS方法共享的根本限制
Uniform distribution近似transmittance的假设虽然粗糙但有效——因为Gaussian splat确实倾向于聚集形成连续表面，合并后的alpha分布趋近uniform。这个观察很有insight
Drop-in replacement设计非常实用：无需重新训练模型，只替换渲染kernel就能在任意3DGS方法上获得多尺度抗锯齿

局限性 / 可改进方向¶

Uniform distribution近似在半透明物体上可能不准确：烟雾、玻璃等场景的alpha分布远非uniform
Window作为方形（axis-aligned rotation ≤45°）的简化可能在某些极端splat分布下引入误差
只在Blender和Mip-NeRF 360上评估：缺少更大规模真实场景（如城市级重建）的验证
没有与supersampling做直接对比来验证近似的精度

评分¶

新颖性: ⭐⭐⭐⭐⭐ 从"alpha blending本身是错的"这个视角切入，不是增量改进而是重新思考基础渲染机制
实验充分度: ⭐⭐⭐⭐ 多尺度Blender和Mip-NeRF 360，多种baseline对比，与多种方法叠加测试
写作质量: ⭐⭐⭐⭐⭐ Figure 2的对比图极其直观地展示了标量blending vs Gaussian Blending的本质区别
价值: ⭐⭐⭐⭐⭐ Drop-in replacement + 实时 + 无需重训 = 极高实用价值，可能成为3DGS渲染的新标准