PhyGaP: Physically-Grounded Gaussians with Polarization Cues¶

会议: CVPR2026 arXiv: 2603.14001 代码: 即将公开领域: 3D视觉 关键词: 3D高斯泼溅, 偏振成像, 逆渲染, 重光照, 反射分解, pBRDF, 环境光照

一句话总结¶

提出 PhyGaP，通过偏振延迟渲染（PolarDR）将偏振线索融入 2DGS 优化，并设计自遮挡感知的 GridMap 环境图技术，实现光泽物体的精确反射分解与真实重光照。

背景与动机¶

反射物体重建困难：3DGS 及其变体缺乏显式几何表示，溅射管线无法模拟二次光传输，对光泽表面建模能力有限。
RGB 图像信息不足：现有 DR 方法依赖对法线、反射率和粗糙度的精确估计，但普通 RGB 图像并不编码这些物理属性，导致 albedo 与反射光分解失败。
重光照质量差：由于反射分解不准确，已有方法在更换光照条件时常出现色偏、不真实阴影甚至表面不连续。
偏振包含丰富物理信息：镜面反射会产生强线性偏振，漫反射产生弱偏振且偏振角偏移 90°，偏振线索天然适合指导反射属性学习。
非凸物体自遮挡问题：环境立方体图假设光源在无穷远处，无法处理非凸物体的自遮挡与间接光照，导致重光照产生伪影。
现有偏振方法不支持重光照：PANDORA 隐式编码环境图，PolGS 不分解 albedo，均无法实现光照替换。

方法详解¶

整体框架¶

PhyGaP 基于 2DGS + Ref-Gaussian 框架，对每个高斯原语维护可学习属性：albedo \(\boldsymbol{\lambda}\)、折射率（IoR）\(\eta\)、表面法线 \(\mathbf{n}\) 和粗糙度 \(r\)，以及一个可学习环境立方体 mipmap \(E\)。通过 α-blending 将属性溅射为 2D 材质图后，送入 PolarDR 计算每像素 Stokes 向量，再用真值偏振信息监督优化。

PolarDR：偏振延迟渲染¶

光的偏振状态用 Stokes 向量 \(\mathbf{s}=[s_0, s_1, s_2, s_3]^\top\) 表示；光与表面交互通过 Mueller 矩阵建模。
镜面偏振：利用 Fresnel 系数 \(R^\perp, R^\parallel\) 计算偏振度 \(\beta_s\)，结合镜面辐射度 \(L_s\) 得到镜面 Stokes 分量。
漫反射偏振：利用透射 Fresnel 系数 \(T^\perp, T^\parallel\) 计算偏振度 \(\beta_d\)，结合漫反射辐射度 \(L_d\) 得到漫反射 Stokes 分量。
两者之和构成渲染 Stokes 向量，与 GT 偏振图直接对比优化，从而显式约束镜面与漫反射分解。
不使用球谐函数表示颜色，因为 albedo 应与视角无关。

GridMap：自遮挡感知环境图¶

在物体包围盒每面划分 3×3 网格，在网格节点放置锚点相机（底面除外，共 \(N=52\) 个）。
对每个锚点相机执行单步光线追踪，构建局部立方体图 \(\tilde{E}_i\)，混合物体自身颜色与全局环境。
渲染时按距离加权融合所有局部立方体图的 Stokes 结果：

\[\tilde{S}_d = \frac{\sum_{i=1}^{N} \|\mathbf{p}-\mathbf{c}_i\|_2 \cdot \tilde{S}_d^{(i)}}{\sum_{i=1}^{N} \|\mathbf{p}-\mathbf{c}_i\|_2}\]

局部立方体图无需梯度且仅需低频更新，开销远低于多次弹射光线追踪。

损失函数¶

\[\mathcal{L} = \mathcal{L}_{\mathrm{rgb}} + \lambda_1 \mathcal{L}_{\mathrm{pol}} + \lambda_2 \mathcal{L}_{\mathrm{mask}} + \lambda_3 \mathcal{L}_{\mathrm{depth}} + \lambda_4 \mathcal{L}_{\mathrm{smooth}}\]

损失项	作用
\(\mathcal{L}_{\mathrm{rgb}}\)	0.8 L1 + 0.2 DSSIM，RGB 重建
\(\mathcal{L}_{\mathrm{pol}}\)	\(s_1, s_2\) 的 L1 损失，偏振重建
\(\mathcal{L}_{\mathrm{mask}}\)	分割掩码监督，消除浮点高斯
\(\mathcal{L}_{\mathrm{depth}}\)	深度-法线一致性，约束 2DGS 对齐表面
\(\mathcal{L}_{\mathrm{smooth}}\)	边缘感知法线平滑，正则化法线变化

实验关键数据¶

新视角合成与法线重建¶

在 9 个场景（PANDORA/RMVP/SMVP/Mitsuba3 数据集）上评测。PhyGaP 相比 RGB 方法平均提升约 2 dB PSNR，法线余弦距离降低 45.7%。

方法	owl PSNR↑	frog PSNR↑	dog PSNR↑	teapot PSNR↑	frog CD↓	dog CD↓	teapot CD↓
Ref-Gaussian	22.39	34.13	37.94	29.67	0.1122	0.0207	0.0093
3DGS-DR	24.20	34.68	39.59	29.07	0.0484	0.0462	0.0325
PolGS	24.99	28.25	28.15	-	0.0343	0.0297	-
PhyGaP	28.14	32.92	37.82	29.69	0.0482	0.0261	0.0079

重光照评测¶

方法	环境图 PSNR (teapot)↑	环境图 PSNR (matpre.)↑	重光照 PSNR↑	重光照 SSIM↑	重光照 LPIPS↓
GIR	10.30	10.73	18.02	0.960	0.0327
PhyGaP	11.50	17.46	19.18	0.973	0.0255

消融实验¶

配置	重光照 PSNR↑	SSIM↑	LPIPS↓
无 PolarDR & 无 GridMap	15.56	0.955	0.0369
仅 PolarDR（无 GridMap）	17.81	0.967	0.0321
完整 PhyGaP	19.18	0.973	0.0255

PolarDR 有效排除镜面反射对 albedo 的污染，提升环境图质量。
GridMap 解决非凸几何的自遮挡阴影，恢复一致的表面颜色。

亮点¶

首个支持重光照的偏振 GS 方法：在 PANDORA、PolGS 等偏振方法均不支持重光照的前提下，PhyGaP 实现了显式反射分解与光照替换。
物理驱动的偏振渲染：PolarDR 将 pBRDF 模型嵌入 GS 延迟渲染，用偏振 Stokes 向量直接监督，避免 albedo-光照歧义。
GridMap 实用高效：52 个锚点相机 + 距离加权融合，在不需要场景特定参数的前提下解决间接光照，开销可控且易于 GPU 并行。
支持部分偏振输入：仅用两个普通 RGB 相机加线偏振片即可采集数据，不依赖专用偏振相机。

局限性 / 可改进方向¶

金属表面建模不足：金属的 pBRDF 涉及复数折射率和相位项，当前模型可能不准确。
GridMap 对极端形状受限：高度不规则的物体或多次互反射的强镜面场景仍有困难。
环境图假设无穷远光源：真实场景中有限距离光源会造成重建偏差。
多次弹射光传输未建模：GridMap 仅做单步光线追踪，复杂互反射场景仍有改进空间。

与相关工作的对比¶

方法	表示	偏振	反射分解	重光照	间接光照
Ref-Gaussian	2DGS+DR	✗	部分	✗	学习 SH
3DGS-DR	3DGS+DR	✗	部分	✗	-
PANDORA	NeRF	✓	✓	✗	隐式
PolGS	3DGS	✓	部分（无 albedo）	✗	-
GIR	3DGS+DR	✗	✓	✓	-
PhyGaP	2DGS+PolarDR	✓	✓（完整）	✓	GridMap

评分¶

新颖性: ⭐⭐⭐⭐ — 将偏振 pBRDF 融入 GS 延迟渲染并设计 GridMap 解决间接光照，技术组合新颖
实验充分度: ⭐⭐⭐⭐ — 9 个场景、合成+真实数据、NVS/法线/分解/重光照多维评测、消融完整
写作质量: ⭐⭐⭐⭐ — 结构清晰，公式推导完整，图表丰富
价值: ⭐⭐⭐⭐ — 首次实现偏振 GS 的重光照能力，对 VR/AR 和交互设计有实际应用前景