跳转至

An Analysis of Concept Bottleneck Models: Measuring, Understanding, and Mitigating Noisy Annotations

会议: NeurIPS 2025
arXiv: 2505.16705
代码: 有
领域: 可解释AI
关键词: 概念瓶颈模型, 噪声标注, SAM, 不确定性, 可解释性

一句话总结

首次系统研究噪声概念标注对 CBM 的影响——发现即使中等噪声也同时损害预测性能、可解释性和干预效果,识别出"脆弱概念"子集是性能下降的主因,提出训练阶段用 SAM 稳定脆弱概念学习 + 推断阶段用预测熵排序仅校正最不确定概念的两阶段缓解框架。

研究背景与动机

  1. 领域现状:CBM 通过将预测分解为人类可解释的中间概念实现透明性(如鸟类分类先预测尾巴形状、体色,再分类)。
  2. 现有痛点:概念标注昂贵且容易出错(人为错误、主观分歧、标注者差异),但噪声标注对 CBM 的影响从未被系统研究。
  3. 核心矛盾:CBM 的可解释性完全依赖概念层的准确性。与端到端模型不同,噪声直接破坏这个中间瓶颈。
  4. 切入角度:测量噪声影响→理解机制(哪些概念脆弱?)→缓解方法(SAM+不确定性校正)。
  5. 核心idea一句话:用 SAM 让优化更平坦以稳定脆弱概念,用熵作为噪声代理在推断时只校正最不确定的概念。

方法详解

关键设计

  1. 脆弱概念识别:发现一小部分概念的准确率下降远超平均水平,且这些概念的损坏占总性能损失的大部分

  2. 训练阶段:SAM

  3. Sharpness-Aware Minimization 稳定脆弱概念的学习,使模型找到更平坦的损失minima
  4. 理论分析说明为什么平坦极小值对标注噪声更鲁棒

  5. 推断阶段:不确定性引导干预

  6. 无干净标签时,用预测熵排序概念
  7. 只校正熵最高的 top-k 概念
  8. 理论分析为什么不确定性能可靠地识别脆弱概念

实验关键数据

主实验(CUB-200 鸟类分类)

噪声比例 标准 CBM Acc + SAM Acc + SAM + 干预 Acc
0% (clean) 持平
20% 显著下降 改善 进一步改善
40% 大幅下降 明显改善 恢复大部分性能

关键发现

  • 噪声不仅降低准确率,还破坏可解释性(概念预测不再有意义)和干预效果(校正概念不再有效)
  • 脆弱概念数量少但影响大(符合帕累托分布)
  • SAM 对脆弱概念的改善尤其显著
  • 预测熵与概念噪声高度相关,是很好的无标签代理

亮点与洞察

  • "脆弱概念"的发现有实际指导意义——标注时应优先质控这些概念
  • SAM + 不确定性干预的两阶段组合优雅地覆盖了训练和推断两个阶段

局限性 / 可改进方向

  • 仅在对称噪声下测试,非对称/结构化噪声未探索
  • 干预需要人在环(推断时校正概念)

评分

  • 新颖性: ⭐⭐⭐⭐ 首次系统研究CBM的噪声鲁棒性
  • 实验充分度: ⭐⭐⭐⭐ 多噪声水平+消融+理论分析
  • 写作质量: ⭐⭐⭐⭐ 测量→理解→缓解的结构清晰
  • 价值: ⭐⭐⭐⭐ 对CBM实际部署有直接指导