Perception Characteristics Distance: Measuring Stability and Robustness of Perception System in Dynamic Conditions under a Certain Decision Rule¶

会议: CVPR2026 arXiv: 2506.09217 代码: datadrivenwheels/PCD_Python 领域: 自动驾驶 / 感知评估 关键词: 感知评估指标, 距离可靠性, 不确定性建模, 方差变化点检测, 自动驾驶安全

一句话总结¶

提出 Perception Characteristics Distance (PCD)，一种量化感知系统在不同距离下可靠检测能力的新指标，通过统计建模检测置信度随距离的均值和方差变化，定义感知系统的最大可靠检测距离，弥补传统 AP/IoU 等静态指标无法反映距离依赖性和随机性的不足。

传统指标的局限：AP、IoU、F1 等经典感知评估指标基于静态逐帧评估，忽略了真实驾驶场景中时间和空间的连续性，无法反映感知系统在不同距离下的稳定性差异
远距离检测不稳定：YOLOX 等检测器在近距离（<30m）时置信度稳定 ≥0.90，但远距离（≥70m）时置信度剧烈波动（可低至 0.24），固定阈值判别存在严重误判风险
阈值化决策的脆弱性：ADAS/ADS 中的控制逻辑通常依赖置信度阈值做二值化判断（检测/未检测），这种方式无法捕捉感知输出的随机性和距离相关变异性
安全性需求：自动驾驶安全依赖于对最大可靠检测距离的准确估计，决策系统需要知道在多远的距离内可以信任感知结果
缺乏受控基准数据集：现有的驾驶数据集（nuScenes、KITTI、BDD100K）均在自然环境中采集，缺乏受控环境下用于系统性评估感知鲁棒性的数据
现有指标不区分条件差异：传统 AP 等指标在不同天气/光照条件下的变化不敏感，无法有效揭示感知系统在恶劣条件下的退化特征

PCD 的核心思路是：将感知输出（IoU × 置信度）建模为距离 \(x\) 的函数，通过统计估计其均值和方差，在给定检测质量阈值 \(y^{thres}\) 和概率阈值 \(p^{thres}\) 下，找到满足可靠性要求的最大距离。

为什么用 IoU × Confidence：单独的置信度只反映模型确信度，IoU 只反映定位精度；二者乘积同时捕捉检测质量和确定性，更适合评估感知稳定性。

方差变化点检测：

PCD 计算：

本文为评估指标论文，不涉及训练损失。PCD 的计算涉及：

惩罚样条回归正则化：\(\sum_{i=1}^n [y_i - \sum_j \beta_j B_j(x_i)]^2 + \lambda \sum_{j=3}^K (\Delta^2 \beta_j)^2\)，其中 \(\lambda=0.6\)
变化点假设检验基于对数似然比和 SIC 准则

实例分割 - 车辆 - 晴天白天：

模型	aPCD (m)	AP50:95	AP50	AR	F1_50
Mask2Former	107.1	0.423	0.633	0.427	0.778
Mask R-CNN	89.8	0.376	0.579	0.381	0.736
ConvNeXt-V2	89.5	0.395	0.553	0.399	0.715
RTMDet	43.5	0.349	0.593	0.353	0.747
SOLOv2	36.6	0.233	0.276	0.237	0.438

目标检测 - 车辆 - 雨天夜晚（aPCD 与传统指标排序不一致的典型案例）：

模型	aPCD (m)	AP50:95	AP50	AR	F1_50
GLIP	37.3	0.133	0.288	0.136	0.451
Grounding DINO	29.6	0.125	0.297	0.128	0.461
YOLOX	23.8	0.106	0.212	0.109	0.353
DyHead	21.5	0.144	0.362	0.146	0.534
Deformable DETR	3.8	0.056	0.133	0.058	0.239

填补指标空白：首次提出距离感知的概率性感知评估指标，将检测可靠性与物理距离直接关联
揭示传统指标的盲区：在雨天夜晚场景，GLIP 的 aPCD 最高但 AP 不是最高，说明 AP 排序无法反映距离维度的稳定性（DyHead 在远距离波动更大）
安全包络定义：PCD 可直接用于定义 ADS 的安全运行包络（safety envelope），指导不同环境条件下的决策距离
受控数据集：SensorRainFall 是唯一在高度受控环境下采集的公开感知评估数据集，排除了混淆变量
统计方法扎实：采用惩罚样条 + 序贯方差变化点检测，有理论支撑的异方差建模