跳转至

Semantic Class Distribution Learning for Debiasing Semi-Supervised Medical Image Segmentation

会议: CVPR2025
arXiv: 2603.05202
代码: GitHub
领域: medical_imaging
关键词: semi-supervised segmentation, class imbalance, class-conditional distribution, proxy learning, medical image segmentation

一句话总结

提出 SCDL 即插即用模块,通过学习类条件代理分布并进行双向对齐(CDBA)+ 语义锚约束(SAC),在嵌入空间显式重塑类条件特征结构,缓解半监督医学影像分割中的监督偏差和表示不平衡。

研究背景与动机

  • 半监督医学影像分割(SSMIS)的类不平衡问题:医学分割数据天然存在像素级长尾分布——大器官占据大量像素主导梯度更新,小器官训练不足
  • 类不平衡 + 半监督的两重挑战
  • 监督信号偏差:大器官占更多像素导致梯度偏向头部类;自生成的伪标签和一致性约束进一步强化头部类学习
  • 表示层不平衡:现有方法(重加权、输出校准)仅作用于损失或输出层,缺乏对类条件特征分布的直接约束,导致尾部类特征漂移到头部类区域
  • 关键洞察:现有方法利用未标注数据主要做局部一致性正则化,很少用来显式修正类条件特征分布的偏斜

方法详解

SCDL 整体框架

  • 即插即用模块,集成到现有分割网络中
  • 充分利用标注数据提供语义监督,同时引导未标注数据在分布层面参与学习

1. 类分布双向对齐(CDBA)

类分布建模:每个语义类 c 用可学习的代理分布表示为 N(μ_c, diag(σ_c²)),均值和方差都是可训练参数

软分配:通过余弦相似度 + softmax 计算每个 token 嵌入对所有类代理的软分配概率 P(c|z),允许每个嵌入关联多个类

双向对齐: - E2P(嵌入→代理):加权余弦距离损失,鼓励嵌入靠近其软分配的代理分布 - P2E(代理→嵌入):鼓励每个代理对其分配的嵌入有高相似度、对其他嵌入有低相似度,增强代理判别性

代理采样与特征丰富: - 分布加权先验:从代理分布采样 S 个样本,用采样相似度加权各类均值 - 中心相似度先验:直接用余弦相似度加权各类均值(忽略方差) - token 采样先验:对每个 token 做局部扰动采样 - 三个先验拼接后投影注入到解码器每层

2. 语义锚约束(SAC)

  • 锚构建:用 ground-truth 掩码提取类特定区域,通过共享编码器得到类感知嵌入,平均后作为语义锚
  • 锚对齐损失:余弦相似度约束每个类代理 μ_c 与其对应语义锚对齐
  • 锚在反向传播时 detach,仅更新代理而不影响编码器
  • 确保代理分布捕获真实类语义,防止被类频率偏差带偏

实验关键数据

数据集

  • Synapse:30 例 CT,13 个器官类别,20% 标注
  • AMOS:360 例 CT,15 个器官类别,5% 标注

Synapse (20% labeled)

方法 DSC↑ ASD↓
VNet (fully) 68.49 6.08
GA-CPS 66.29 5.44
SCDL-GA-CPS 67.50 3.32
GA-MagicNet 66.00 3.42
SCDL-GA-MagicNet 66.75 3.65
  • SCDL-GA-CPS 的 ASD 降低 2.12(5.44→3.32),边界质量显著提升

AMOS (5% labeled)

方法 DSC↑ ASD↓
GenericSSL 35.73 45.82
SCDL-GenericSSL 47.35 (+11.62) 22.84
DHC 40.11 40.65
SCDL-DHC 49.28 (+9.17) 17.47 (-23.18)
GA-MagicNet 59.15 8.66
SCDL-GA-MagicNet 62.16 (+3.01) 5.65
  • 在标注更稀少的 AMOS 上提升更显著:SCDL-GenericSSL DSC +11.62%,SCDL-DHC ASD 从 40.65 骤降至 17.47

逐类 Dice 分析

  • 对尾部类贡献尤为显著:如 Synapse 上 SCDL-GA-CPS 的胰腺(PA)从 45.5→49.4,右肾上腺(RAG)从 44.7→49.2
  • AMOS 上原本 Dice 为 0 的类(如 RAG/LAG 在 GenericSSL 和 DHC 中)在加入 SCDL 后获得非零 Dice

亮点

  1. 即插即用设计:SCDL 能无缝集成到多种半监督分割基线(GenericSSL、DHC、GA-MagicNet、GA-CPS),一致带来提升
  2. 表示层去偏:不同于损失/输出层操作,直接在嵌入空间学习类条件分布结构,从根本上解决表示偏倚
  3. 双向对齐机制:E2P + P2E 互补,既让嵌入靠近正确代理,又让代理具备判别性
  4. 语义锚引导:用标注数据为代理学习提供可靠的语义监督,防止代理发散
  5. 尾部类增益显著:在极端稀少标注下(5%),让原本完全失败的类别获得有意义的分割

局限性

  1. 代理分布假设为对角高斯,可能无法捕获复杂的多模态类条件分布
  2. SAC 的语义锚依赖标注数据,在极少标注时锚的质量可能不稳定
  3. 三种先验(分布加权、中心相似度、token 采样)的拼接注入方式较为朴素,缺乏自适应融合
  4. 仅在 CT 数据集上验证,MRI 等其他模态的适用性未探讨
  5. 代理采样数 S 和投影维度等超参数的敏感性分析未充分展示

评分

  • 新颖性: 4/5 — 类条件代理分布建模 + 双向对齐在半监督分割中是新颖且有洞察力的设计
  • 实验充分度: 4/5 — 两个数据集、多个基线集成、逐类分析,但缺少消融实验详细展示
  • 写作质量: 4/5 — 动机阐述清晰、方法描述严谨,图示直观
  • 价值: 4/5 — 即插即用模块对实际医学分割场景有直接实用价值