COOPERTRIM: Adaptive Data Selection for Uncertainty-Aware Cooperative Perception¶

会议: ICLR 2026
arXiv: 2602.13287
代码: https://cisl.ucr.edu/CooperTrim
领域: 自动驾驶 / 协同感知
关键词: 协同感知, 带宽优化, 时序不确定性, 特征选择, 共形预测

一句话总结¶

提出 CooperTrim 自适应特征选择框架，通过共形时序不确定性度量评估特征相关性，并用数据驱动机制动态决定共享数量，在协同语义分割中实现 80.28% 带宽降低且性能可比，首次将选择性共享应用于协同分割任务。

领域现状：协同感知使自动驾驶车辆共享编码表示以增强态势感知。中间融合方案是主流，但传输的特征量仍然压迫无线带宽（通常 ~40 Mbps）。现有带宽优化方法包括压缩（信息有损）、选择（固定阈值）和混合策略。
现有痛点：(a) Where2Comm 用固定阈值的置信度图选择特征，忽略时序上下文，带宽仍高（39.6 Mbps）；(b) SwissCheese 用固定阈值做通道/空间选择，缺乏环境自适应；(c) 所有方法逐帧独立决策，重复传输静态信息。
核心矛盾：有限带宽与丰富传感器信息的根本矛盾——现有方法只是"每帧少传"，未利用时序连续性来"按需传"。
本文要解决什么？ (a) 利用时序上下文识别真正需要更新的动态特征；(b) 根据环境复杂度自适应调整共享量。
切入角度：接收方（ego vehicle）可以用自身的时序记忆判断哪些特征是"新信息"（时序不确定性高），只请求那些有变化的特征。简单场景少传，复杂场景多传。
核心idea一句话：用时序不确定性而非静态置信度来衡量特征相关性，实现环境自适应的按需共享。

Ego 车辆从当前帧特征 \(F_t\) 和融合过的上一帧特征 \(F_{t-1}^{\text{fused}}\) 计算共形时序不确定性，通过可学习分位阈值 \(q\) 和注意力掩码阈值 \(\tau\) 确定要请求的特征子集，广播请求向量，接收协作车辆的选定特征后融合。

共形时序不确定性:
做什么：量化每个特征通道相对于时序上下文的变化程度
核心思路：计算当前帧与上一融合帧的 L1 距离 \(S_t = |F_t - F_{t-1}^{\text{fused}}|\)，用可学习分位阈值 \(q\) 做门控（共形预测启发），只保留变化超过 \(q\) 的特征作为"不确定"
设计动机：静态场景中大部分特征帧间不变——无需重复传输
自适应数量确定:
做什么：根据环境复杂度动态调整共享特征数量
核心思路：对不确定特征施加交叉注意力加权，通过可学习掩码阈值 \(\tau\) 截断——复杂场景（多交叉路口）产生高相关性分数→更多特征超过阈值→更多传输
设计动机：实现"简单场景少传，复杂场景多传"的自适应行为
\(\epsilon\)-Greedy 训练策略:
做什么：平衡全特征训练和选择特征训练
核心思路：以 \(\epsilon\) 概率使用全部特征（exploration），\((1-\epsilon)\) 概率使用选择的特征（exploitation）。理论证明这减少了梯度估计器的偏差和方差
设计动机：仅用部分特征训练可能导致梯度噪声大、收敛不稳定

拉格朗日约束优化：\(\theta^* = \arg\min_\theta L(C(\theta)) + \lambda \cdot (P(C(\theta)) - C_{1.6})\)，目标是在带宽约束 1.6 Mbps 下最大化任务性能。\(\lambda\) 动态调整。

协同语义分割（OPV2V 数据集，应用于 CoBEVT/AttFuse/DiscoNet）：

配置	动态 IoU	带宽使用率	带宽降低
CoBEVT 原版	基线	100% (40Mbps)	—
CooperTrim-CoBEVT	可比	27.9%	72.1%
CooperTrim-AttFuse	可比	21.07%	78.93%
CooperTrim-DiscoNet	可比	10.18%	89.82%

vs 其他选择策略：