Bidirectional Uncertainty-Based Active Learning for Open-Set Annotation¶

会议: ECCV2024
arXiv: 2402.15198
代码: GitHub
领域: others
关键词: Active Learning, Open-Set Annotation, Negative Learning, Uncertainty Estimation

一句话总结¶

提出 BUAL 框架，通过 Random Label Negative Learning 将未知类样本推向高置信区域、已知类样本推向低置信区域，结合双向不确定性采样策略，在开放集场景下有效选出高信息量的已知类样本。

主动学习的核心目标：从未标注数据池中迭代选出最有信息量的样本送给标注者，以最小标注成本训练高效模型
封闭集假设的局限：传统 AL 方法假设未标注池中的类别与目标任务完全一致，但实际场景中往往混入大量未知类（open-set）样本
已有方法的两难困境：
- 传统不确定性方法（LC / Margin / Entropy）倾向于选低置信度样本，但未知类样本同样具有低置信度，容易误选
- 开放集标注方法（CCAL、LfOSA）优先选最可能属于已知类的样本，但这些往往是模型已经掌握的"简单样本"，对训练帮助有限
- 两类方法对 openness ratio 敏感：OSA 方法在低开放度时不如随机采样，传统方法在高开放度时失效

如何在开放集场景中，同时满足"高信息量"和"属于已知类"两个目标进行样本选择？

关键洞察：如果能将未知类样本推向高置信度区域，则现有基于不确定性的 AL 方法可以直接用于开放集场景——低置信度区域中剩下的就是信息量高的已知类样本。

核心思想：利用 Negative Learning（互补标签学习）微调模型，实现已知/未知类样本在置信度空间上的分离。

训练流程：

第一阶段（正向训练）：用标注的已知类数据 \(D_l^{kno}\) 以交叉熵正常训练 \(K\) 类分类器 \(f_p(\cdot)\)（positive classifier）
第二阶段（负向微调）：替换最后一层分类头，用 Negative Learning 损失微调得到 \(f_n(\cdot)\)（negative classifier）

Negative Learning 损失函数：

\[\ell_{NL}(f, \bar{y}) = -\sum_{k=1}^{K} \bar{y}_k \log(1 - p_k)\]

随机标签分配策略：

为什么 RLNL 有效？

未标注的已知类样本有 \(1/K\) 概率被分到正确标签，此时会受到较大惩罚被推向低置信区域；同时它们在特征空间中与已标注数据有重叠，受到先验知识的隐式约束
未标注的未知类样本永远不会被分到正确标签（因为其真实类别不在 \(\mathcal{Y}\) 中），在批量梯度更新下会振荡到远离决策边界的高置信区域
t-SNE 可视化实验验证：RLNL 后未知类样本特征明显远离决策边界，已知类样本保持在标注数据附近

由于负向分类器 \(f_n(\cdot)\) 训练不稳定，预测会在 epoch 间振荡，因此：

双向不确定性采样公式：

\[x^* = \arg\max_x \; p_{K+1}^{aux}(x) \cdot unc_n + r \cdot [1 - p_{K+1}^{aux}(x)] \cdot unc_p\]

其中：

自适应退化：当没有未知类样本时，\(r=1, p_{K+1}^{aux}=0\)，公式退化为标准不确定性采样。

数据集：CIFAR-10、CIFAR-100、Tiny-ImageNet，openness ratio 设置为 0.2/0.4/0.6/0.8

主要结论（最终轮平均准确率）：

方法	CIFAR-10 (0.6)	CIFAR-100 (0.6)	Tiny-ImageNet (0.6)
Random	87.2	58.7	50.9
Margin	89.0	58.8	50.8
LfOSA	87.0	62.4	52.4
CCAL	88.0	64.7	50.3
B-Margin	92.6	68.3	55.7

方法	策略类型	核心思路	对开放度的鲁棒性
LC / Margin / Entropy	不确定性	选低置信样本	高开放度时失效
Coreset / BADGE	多样性/混合	选分布代表性样本	未知类特征差异大导致误选
CCAL	对比学习	选语义上像已知类的样本	低开放度时不如随机
LfOSA	MAV 建模	选最大激活值高的样本	选到的是简单样本
DIAS	开集识别	先识别未知类再过滤	标注数据少时识别能力差
BUAL	双向不确定性	推开未知类 + 双向采样	各开放度下均稳定