跳转至

A Real-world Display Inverse Rendering Dataset

会议: ICCV 2025
arXiv: 2508.14411
代码: https://michaelcsj.github.io/DIR/ (项目页,含代码和数据集)
领域: 3D视觉 / 逆渲染 / 数据集
关键词: 逆渲染, LCD显示器光源, 光度立体, BRDF, 偏振成像

一句话总结

构建了首个基于LCD显示器-相机系统的真实世界逆渲染数据集,包含16个物体的OLAT(逐像素点亮)采集图像、偏振信息和GT几何,并提出简单有效的基线方法(基于Cook-Torrance BRDF的可微渲染优化),在150秒内超越现有逆渲染方法。

背景与动机

逆渲染需要在多光照条件下采集物体图像。Light stage成本高昂,手持闪光灯采集需多次拍摄。LCD显示器可作为高分辨率可编程面光源,且自带偏振特性可分离漫反射和镜面反射——是理想的低成本逆渲染平台。但此前没有基于显示器-相机系统的公开真实世界数据集,阻碍了该方向的发展。

核心问题

填补display-camera逆渲染领域的数据集空白。同时,显示器逆渲染面临独特挑战:近场光照、有限的光-视角角度采样、显示器背光干扰、低信噪比——需要评估现有方法在这些条件下的表现。

方法详解

整体框架

输入:LCD显示器发出OLAT照明模式,立体偏振相机采集图像 → 通过偏振分离得到漫反射/镜面反射图像 → 利用OLAT线性叠加模拟任意照明 → 基线方法:光度立体初始化法线+立体匹配初始化深度 → Cook-Torrance BRDF可微渲染优化

关键设计

  1. 显示器-相机成像系统: Samsung Odyssey Ark LCD显示器(600 cd/m²) + FLIR立体偏振RGB相机对。显示器像素分为16×9=144个超像素(每个240×240物理像素),解决单像素亮度不足问题。标定显示器背光(空间变化)和非线性响应(gamma)。
  2. 偏振漫反射-镜面反射分离: LCD发出垂直偏振光,镜面反射保持偏振态,漫反射变为非偏振。通过Stokes矢量分析4个偏振角度(0°,45°,90°,135°)的图像,分离出漫反射和镜面反射分量。
  3. 基线逆渲染方法: 用分析光度立体初始化法线,RAFT-Stereo初始化深度。采用基BRDF表示(Cook-Torrance模型的加权和),通过可微渲染优化法线+反射率参数。150秒内完成。

损失函数 / 训练策略

  • 基线方法的优化目标:最小化渲染OLAT图像与实际采集图像之间的RMSE
  • 背光标定:优化全局缩放因子s、空间变化背光B_i和gamma参数γ

实验关键数据

光度立体评估(OLAT模式)

方法 类型 平均MAE(°)
SDM-UniPS 无标定 14.84
PS-FCN 标定 ~17.29
Woodham 标定 ~24.34

逆渲染评估

方法 重光照PSNR(dB) 重光照SSIM 法线MAE(°)
本文基线(OLAT) 39.33-41.28 ~0.989 20.94
SRSH 37.27 0.977 23.97

消融实验要点

  • 仅用2个复用照明模式仍可实现合理精度(PSNR ~37-38 dB)
  • 偏振分离后的漫反射图像可提高部分方法的法线重建精度
  • 近场光衰减建模对结果影响显著(不建模时PSNR从39.78降至37.43)
  • 显示器尺寸和分辨率对不同方法影响各异

亮点 / 我学到了什么

  • LCD偏振特性的巧妙利用: LCD天然发出偏振光,配合偏振相机就能免费获得漫反射-镜面反射分离,无需额外光学元件
  • OLAT线性叠加: 因为光传输是线性的,144张OLAT图像可以线性组合模拟任意照明模式——大大扩展了数据集的用途
  • 数据集设计的参考价值: 16个物体涵盖从漫反射到镜面的多种材质(树脂、陶瓷、金属漆、木头等),GT几何通过结构光扫描获得(0.05mm精度)

局限性 / 可改进方向

  • 显示器亮度有限,单超像素0.06 mcd,导致采集图像信噪比低
  • 光-视角角度覆盖有限(受显示器和相机空间布局约束)
  • 仅有2个视角(立体相机),无法做全方位逆渲染
  • 基线方法的法线精度仍有较大提升空间(MAE ~21°)
  • 未探索学习型方法在此数据集上的潜力

与相关工作的对比

  • vs Light stage数据集(如DiLiGenT): 本文用LCD代替LED阵列,成本和体积大幅降低,但光强和角度覆盖受限
  • vs Stanford-ORB: Stanford-ORB用自然光照+环境贴图,本文用可控LED平面光源,提供更精确的光照标定
  • vs DDPS: 本文在DDPS的基础上扩展为完整的逆渲染数据集,从光度立体扩展到反射率重建

与我的研究方向的关联

  • 展示了如何用消费级硬件(显示器+相机)做高质量数据采集的思路
  • 偏振分离可启发其他方向(如自动驾驶中的材质估计)
  • 数据集格式设计可作为构建新基准的参考

评分

  • 新颖性: ⭐⭐⭐⭐ 首个display逆渲染数据集,填补空白
  • 实验充分度: ⭐⭐⭐⭐⭐ 评估了大量现有方法,涵盖多种实验设置
  • 写作质量: ⭐⭐⭐⭐ 系统描述清晰,标定过程详尽
  • 对我的价值: ⭐⭐⭐ 非直接相关,但数据集设计思路有参考价值