Free-running vs. Synchronous: Single-Photon Lidar for High-flux 3D Imaging¶

会议: ICCV 2025
arXiv: 2507.09386
代码: 无
领域: 自动驾驶 / 3D视觉
关键词: 单光子激光雷达, 自由运行模式, 最大似然估计, 深度正则化, 高通量3D成像

一句话总结¶

本文系统比较了单光子激光雷达（SPL）的自由运行模式和同步模式在高通量条件下的深度成像性能，提出了高效的联合最大似然估计器和基于分数模型的深度正则化算法 SSDR，证明自由运行模式在各种光通量和信背比条件下均优于同步模式。

研究背景与动机¶

领域现状：单光子激光雷达（SPL）利用皮秒级激光和单光子探测器实现高分辨率测距，广泛应用于地形测绘、水下探测和自动驾驶。SPL 系统中单光子雪崩二极管（SPAD）是核心探测器件，其在检测光子后需要一段"死时间"（dead time）来完成淬灭和重新激活。

现有痛点：传统观点认为 SPL 应在低通量条件下工作以最小化死时间效应（5% 规则），但这严重限制了数据采集速率和信噪比。同步模式（检测后等到下一脉冲才重新激活）因统计独立性而被广泛研究，但其"pile-up"效应会在高通量下严重扭曲直方图，掩盖深度信息。自由运行模式（死时间结束后立即重新激活）虽然直方图畸变更小，但因检测时间的统计依赖性导致似然函数复杂，可用方法极少。

核心矛盾：高通量条件下 SPL 性能急剧下降——同步模式受 pile-up 困扰，自由运行模式缺乏高效的估计算法。现有方法要么假设低通量（忽略死时间），要么仅针对同步模式设计校正。

本文目标：(1) 推导自由运行和同步模式下信号通量、背景通量和深度的联合 ML 估计器；(2) 通过理论和实验证明自由运行模式的优越性；(3) 提出结合学习先验的深度正则化框架。

切入角度：作者从自由运行模式的似然函数出发，发现可以通过匹配滤波将深度估计转化为高效计算，同时利用点云分数模型作为 3D 结构先验来正则化深度重建。

核心 idea：推导自由运行 SPL 的高效联合 ML 估计器，将深度估计转化为匹配滤波问题，并提出 SSDR 算法结合点云分数先验实现高通量 3D 重建，最终证明自由运行模式全面优于同步模式。

方法详解¶

整体框架¶

系统包含两个层次：(1) 像素级 ML 估计——对每个扫描位置的检测时间直方图，联合估计信号通量 \(S\)、背景通量 \(B\) 和深度 \(z\)；(2) 多像素正则化——利用 SSDR 算法结合点云分数模型对 ML 深度估计进行空间正则化，提升 3D 重建质量。输入是 SPAD 检测的时间戳集合，输出是高精度 3D 点云。

关键设计¶

联合最大似然估计器:
- 功能：从 SPL 直方图中同时估计信号通量、背景通量和深度三个参数
- 核心思路：推导了三种探测器模式（理想、同步、自由运行）的对数似然函数。对于自由运行模式，检测时间服从自激点过程，其近似对数似然为 \(\mathcal{L}_{\text{free}} \approx -n_r \Lambda + \sum_{i=1}^{N} \log \tilde{\lambda}(X_i) + \Phi(X_i + t_d) - \Phi(X_i)\)。采用交替最大化策略：固定 \(z\) 用 L-BFGS-B 优化 \((S, B)\)，固定 \((S, B)\) 用匹配滤波优化 \(z\)
- 设计动机：之前的方法要么需要预先标定背景通量，要么无法进行联合估计。本方法首次实现了三参数联合估计，且深度精度不依赖于直方图 bin 大小
基于匹配滤波的深度估计:
- 功能：将深度的 ML 估计转化为高效的相关运算
- 核心思路：对于自由运行模式，深度估计表示为 \(\hat{\tau}_{\text{free}} = \arg\max_\tau h(\tau) \otimes u(\tau) + g(\tau) \otimes v(\tau)\)，其中 \(h(\tau)\) 是检测时间直方图，\(g(\tau)\) 是 \(h\) 的周期平移版本，\(u\) 和 \(v\) 是滤波器。这可以通过 FFT 高效计算。与 Rapp 等人基于稳态分布的方法相比，在 10000 bins 下速度提升约 5000 倍（14.3s vs 2.84ms）
- 设计动机：之前的自由运行估计方法涉及昂贵的特征向量计算（求马尔可夫链稳态分布），计算复杂度随 bin 数急剧增长，不适用于实时系统
Score-based SPL Depth Regularization (SSDR):
- 功能：利用学习的点云分数模型作为空间先验，对像素级 ML 深度估计进行正则化
- 核心思路：使用预训练的点云去噪模型估计 3D 点云的 Stein score \(\mathbf{s}_p\)，将其投影到探测器视线方向得到深度 score \(\sigma_p = \langle \mathbf{s}_p, \hat{\mathbf{r}}_p \rangle\)。算法基于 Plug-and-Play Monte Carlo 框架，先用中值平滑初始化异常深度值，再迭代更新。关键创新是对深度 score 进行硬阈值截断（只保留大 score），因为小 score 区域的先验指导不可靠
- 设计动机：ML 估计是逐像素独立的，未利用空间结构信息。与传统的全变分正则化不同，SSDR 直接在 3D 点云空间建模先验，对任意扫描位置（不限于均匀网格）都适用

损失函数 / 训练策略¶

ML 估计采用交替最大化对数似然函数。SSDR 的迭代更新包含三项：对数似然的梯度（数据保真项）、深度 score（先验项）和噪声项（避免局部最优）。超参数（阈值 \(\epsilon\)、步长 \(\gamma\)、正则化权重 \(\alpha\)）通过 Optuna 在独立数据集上调优。

实验关键数据¶

主实验¶

场景 / 模式	RMSE(\(\hat{S}\))	MAE(\(\hat{z}\))	说明
Duck / Sync ML	2.5×10⁻²	0.084 m	同步模式 pile-up 导致深度误差
Duck / Free ML	2.4×10⁻²	0.022 m	自由运行误差显著更低
Duck / Free+SSDR	2.4×10⁻²	0.007 m	SSDR 进一步降低67%
Man / Sync ML	1.8×10⁻²	0.307 m	同步模式在远深度失效
Man / Free ML	1.8×10⁻²	0.294 m	自由运行更鲁棒
Man / Free+SSDR	1.8×10⁻²	0.020 m	SSDR 提升 93%
实验 Dog / Sync	—	2.137 m	同步模式完全失败
实验 Dog / Free ML	—	0.136 m	自由运行可用
实验 Dog / Free+SSDR	—	0.098 m	SSDR 进一步优化 28%

消融实验¶

SSDR 配置	对 RMSE 的影响	说明
完整 SSDR	最低 RMSE	三组件协同
w/o 深度 score 阈值	RMSE 随迭代上升	影响最大，缺失后无法收敛
w/o 中值平滑初始化	RMSE 先降后停滞	第二重要，缺失导致陷入局部最优
w/o 迭代噪声	RMSE 接近完整	影响最小，但在某些场景帮助跳出局部最优

关键发现¶

自由运行模式全面优于同步模式：在不同通量水平、信背比（SBR）、深度和死时间条件下，自由运行的估计误差始终更低。即使死时间长达 90ns（占 90% 重复周期），自由运行仍然占优
最优通量远高于 5% 规则：自由运行模式的最优通量 \(\Lambda^*\) 显著高于传统推荐值（\(\Lambda < 0.05\)），表明可以在更高光通量下获得更好性能
同步模式的深度误差依赖于目标深度（越深越差，因为 pile-up 效应在远距离更严重），而自由运行模式的误差与深度无关
SSDR 的深度 score 阈值是最关键组件——去掉后 RMSE 不降反升，说明不加选择地使用先验会引入误导

亮点与洞察¶

将深度估计转化为匹配滤波是本文最优雅的技术贡献——利用对数似然的结构推导出解析形式的相关滤波器，使自由运行模式的算法复杂度从 O(M³) 降到 O(M log M)，这是让自由运行模式实用化的关键
"自由运行全面优于同步"的结论颠覆了传统认知——此前同步模式因统计独立性被认为更优，本文的理论和实验证据改变了这一观点
SSDR 中利用 3D 点云 score 模型作为先验的思路很有前瞻性——它与深度图先验不同，是视点无关的，可以推广到任意扫描几何结构。这种方法可以迁移到其他需要 3D 正则化的逆问题中

局限与展望¶

SSDR 使用的点云分数模型仅在孤立 3D 模型数据集上训练，对复杂多目标场景的适用性有限——实验中不同深度目标的场景效果不理想
未考虑多目标/多深度情况——每个像素假设只有一个目标深度，无法处理半透明物体或雾气散射
当前方法仅正则化深度，信号通量和背景通量的正则化留作未来工作
实验验证场景规模较小（64×64 扫描网格），大规模户外场景（如自动驾驶）的可扩展性未知
未来可以训练更大规模、更多样化的 3D 分数模型，或探索将推导的似然函数集成到已有的正则化框架（TV、ManiPoP、RT3D）中

评分¶

新颖性: ⭐⭐⭐⭐ 联合 ML 估计器和匹配滤波推导是扎实的原创贡献，SSDR 首次将学习的 3D 先验用于 SPL
实验充分度: ⭐⭐⭐⭐⭐ 仿真覆盖全面（不同通量、SBR、深度、死时间），有真实硬件实验验证，消融充分
写作质量: ⭐⭐⭐⭐⭐ 数学推导严谨清晰，图表丰富且信息密度高，20页含丰富的补充材料
价值: ⭐⭐⭐⭐ 对 SPL 社区有重要指导意义，改变了对同步/自由运行模式的传统认知