Towards Robust Pseudo-Label Learning in Semantic Segmentation: An Encoding Perspective¶
会议: NEURIPS2025
arXiv: 2512.06870
代码: GitHub
领域: segmentation
关键词: pseudo-label learning, error-correcting output codes, semantic segmentation, domain adaptation, semi-supervised learning
一句话总结¶
提出 ECOCSeg,用纠错输出码(ECOC)替代 one-hot 编码来表示伪标签,将 N 类分类分解为 K 个二分类子任务,通过 bit 级去噪和可靠位挖掘生成更鲁棒的伪标签,在 UDA 和 SSL 分割任务上一致提升。
背景与动机¶
- 伪标签学习广泛用于标注稀缺场景(UDA、SSL),但伪标签中的错误会在训练中被放大
- 现有方法主要关注伪标签的选择策略(阈值过滤、加权),但忽略了类别编码形式的影响
- 关键观察:相似类别共享视觉属性(如 sheep/cow 都有角和蹄),one-hot 编码无法利用这种共性
- 当伪标签预测错误时,共享属性仍可提供有效监督
核心问题¶
如何利用类别间的共享属性设计适合伪标签学习的编码形式,使其对标签噪声更鲁棒?
方法详解¶
- ECOC 编码替代 one-hot:
- 为每个类别分配一个 K-bit 二进制码字,将 N 类分类分解为 K 个二分类器
- 两种编码策略:Max-min 距离编码(最大化码距鲁棒性)和文本编码(利用类间语义关系)
- 分类通过软 Hamming 距离最近邻查询码本实现
- Bit 级伪标签去噪:
- Bit-wise 标签:直接量化网络输出为 bit 级编码(更软的监督)
- Code-wise 标签:查询码本最近码字(可纠正错误 bit 但可能引入新噪声)
- 可靠位挖掘算法:识别候选类别的共享 bit 作为可靠位,融合两种标签
- 定制优化准则:
- Pixel-code distance:拉近像素特征与正确码字的距离
- Pixel-code contrast:类内紧凑 + 类间分离
实验关键数据¶
- UDA(GTAv→Cityscapes):
- DACS+ECOCSeg: +2.4% mIoU;DAFormer+ECOCSeg: +2.2%;MIC+ECOCSeg: +1.0%
- UDA(SYNTHIA→Cityscapes):
- DACS+ECOCSeg: +2.9%;DAFormer+ECOCSeg: +2.4%;MIC+ECOCSeg: +1.7%
- SSL(Pascal VOC,1/16~1/4 标注):
- 在 3 种 SSL 框架上一致提升 1.1%~3.7%
- 消融:ECOC 编码在全监督下也优于 one-hot(+0.5%),且在伪标签学习下优势更大
- 理论保证:在充分大的最小码距下,ECOC 的分类错误界更紧
亮点¶
- 从编码角度分析伪标签学习是全新视角,与现有选择/加权策略正交
- 理论分析:ECOC 在伪标签噪声下具有更紧的错误界
- 即插即用:可直接集成到现有 UDA/SSL 框架上一致提升
- 可靠位挖掘算法巧妙融合两种伪标签形式的优势
局限性 / 可改进方向¶
- ECOC 码长 K 的选择需要平衡(太短区分不够,太长计算开销大)
- 当前编码策略(max-min、text-based)仍较简单,可探索学习的编码方式
- 仅在分割任务验证,可推广到其他伪标签学习场景(检测、深度估计等)
- 需要额外的 K 个二分类器头,增加了一定计算开销
与相关工作的对比¶
| 方法 | 关注点 | 编码形式 | 即插即用 |
|---|---|---|---|
| 阈值过滤 | 选择策略 | one-hot | ✓ |
| 加权/CPS | 选择策略 | one-hot | ✓ |
| 负学习 | 优化准则 | one-hot | 部分 |
| ECOCSeg | 编码形式 | ECOC | ✓ |
启发与关联¶
- 核心 insight:编码形式本身就是应对标签噪声的有效工具,不仅仅是选择"哪些标签可靠"
- 共享属性的利用思路可以推广到其他需要处理类别混淆的任务
- 与信息论中纠错码的思想高度一致,两个领域的交叉值得深入
评分¶
- 新颖性: ⭐⭐⭐⭐ (编码视角非常新颖,引入纠错码理论到分割)
- 实验充分度: ⭐⭐⭐⭐ (UDA+SSL,多框架多数据集,有理论分析)
- 写作质量: ⭐⭐⭐⭐ (问题分析到解决方案逻辑清晰)
- 价值: ⭐⭐⭐⭐ (即插即用特性有实际价值)