A Real-world Display Inverse Rendering Dataset¶
会议: ICCV 2025
arXiv: 2508.14411
代码: https://michaelcsj.github.io/DIR/ (项目页,含代码和数据集)
领域: 3D视觉 / 逆渲染 / 数据集
关键词: 逆渲染, LCD显示器光源, 光度立体, BRDF, 偏振成像
一句话总结¶
构建了首个基于LCD显示器-相机系统的真实世界逆渲染数据集,包含16个物体的OLAT(逐像素点亮)采集图像、偏振信息和GT几何,并提出简单有效的基线方法(基于Cook-Torrance BRDF的可微渲染优化),在150秒内超越现有逆渲染方法。
背景与动机¶
逆渲染需要在多光照条件下采集物体图像。Light stage成本高昂,手持闪光灯采集需多次拍摄。LCD显示器可作为高分辨率可编程面光源,且自带偏振特性可分离漫反射和镜面反射——是理想的低成本逆渲染平台。但此前没有基于显示器-相机系统的公开真实世界数据集,阻碍了该方向的发展。
核心问题¶
填补display-camera逆渲染领域的数据集空白。同时,显示器逆渲染面临独特挑战:近场光照、有限的光-视角角度采样、显示器背光干扰、低信噪比——需要评估现有方法在这些条件下的表现。
方法详解¶
整体框架¶
输入:LCD显示器发出OLAT照明模式,立体偏振相机采集图像 → 通过偏振分离得到漫反射/镜面反射图像 → 利用OLAT线性叠加模拟任意照明 → 基线方法:光度立体初始化法线+立体匹配初始化深度 → Cook-Torrance BRDF可微渲染优化
关键设计¶
- 显示器-相机成像系统: Samsung Odyssey Ark LCD显示器(600 cd/m²) + FLIR立体偏振RGB相机对。显示器像素分为16×9=144个超像素(每个240×240物理像素),解决单像素亮度不足问题。标定显示器背光(空间变化)和非线性响应(gamma)。
- 偏振漫反射-镜面反射分离: LCD发出垂直偏振光,镜面反射保持偏振态,漫反射变为非偏振。通过Stokes矢量分析4个偏振角度(0°,45°,90°,135°)的图像,分离出漫反射和镜面反射分量。
- 基线逆渲染方法: 用分析光度立体初始化法线,RAFT-Stereo初始化深度。采用基BRDF表示(Cook-Torrance模型的加权和),通过可微渲染优化法线+反射率参数。150秒内完成。
损失函数 / 训练策略¶
- 基线方法的优化目标:最小化渲染OLAT图像与实际采集图像之间的RMSE
- 背光标定:优化全局缩放因子s、空间变化背光B_i和gamma参数γ
实验关键数据¶
光度立体评估(OLAT模式)¶
| 方法 | 类型 | 平均MAE(°) |
|---|---|---|
| SDM-UniPS | 无标定 | 14.84 |
| PS-FCN | 标定 | ~17.29 |
| Woodham | 标定 | ~24.34 |
逆渲染评估¶
| 方法 | 重光照PSNR(dB) | 重光照SSIM | 法线MAE(°) |
|---|---|---|---|
| 本文基线(OLAT) | 39.33-41.28 | ~0.989 | 20.94 |
| SRSH | 37.27 | 0.977 | 23.97 |
消融实验要点¶
- 仅用2个复用照明模式仍可实现合理精度(PSNR ~37-38 dB)
- 偏振分离后的漫反射图像可提高部分方法的法线重建精度
- 近场光衰减建模对结果影响显著(不建模时PSNR从39.78降至37.43)
- 显示器尺寸和分辨率对不同方法影响各异
亮点 / 我学到了什么¶
- LCD偏振特性的巧妙利用: LCD天然发出偏振光,配合偏振相机就能免费获得漫反射-镜面反射分离,无需额外光学元件
- OLAT线性叠加: 因为光传输是线性的,144张OLAT图像可以线性组合模拟任意照明模式——大大扩展了数据集的用途
- 数据集设计的参考价值: 16个物体涵盖从漫反射到镜面的多种材质(树脂、陶瓷、金属漆、木头等),GT几何通过结构光扫描获得(0.05mm精度)
局限性 / 可改进方向¶
- 显示器亮度有限,单超像素0.06 mcd,导致采集图像信噪比低
- 光-视角角度覆盖有限(受显示器和相机空间布局约束)
- 仅有2个视角(立体相机),无法做全方位逆渲染
- 基线方法的法线精度仍有较大提升空间(MAE ~21°)
- 未探索学习型方法在此数据集上的潜力
与相关工作的对比¶
- vs Light stage数据集(如DiLiGenT): 本文用LCD代替LED阵列,成本和体积大幅降低,但光强和角度覆盖受限
- vs Stanford-ORB: Stanford-ORB用自然光照+环境贴图,本文用可控LED平面光源,提供更精确的光照标定
- vs DDPS: 本文在DDPS的基础上扩展为完整的逆渲染数据集,从光度立体扩展到反射率重建
与我的研究方向的关联¶
- 展示了如何用消费级硬件(显示器+相机)做高质量数据采集的思路
- 偏振分离可启发其他方向(如自动驾驶中的材质估计)
- 数据集格式设计可作为构建新基准的参考
评分¶
- 新颖性: ⭐⭐⭐⭐ 首个display逆渲染数据集,填补空白
- 实验充分度: ⭐⭐⭐⭐⭐ 评估了大量现有方法,涵盖多种实验设置
- 写作质量: ⭐⭐⭐⭐ 系统描述清晰,标定过程详尽
- 对我的价值: ⭐⭐⭐ 非直接相关,但数据集设计思路有参考价值