Semantic Class Distribution Learning for Debiasing Semi-Supervised Medical Image Segmentation¶

会议: CVPR2025
arXiv: 2603.05202
代码: GitHub
领域: medical_imaging
关键词: semi-supervised segmentation, class imbalance, class-conditional distribution, proxy learning, medical image segmentation

一句话总结¶

提出 SCDL 即插即用模块，通过学习类条件代理分布并进行双向对齐（CDBA）+ 语义锚约束（SAC），在嵌入空间显式重塑类条件特征结构，缓解半监督医学影像分割中的监督偏差和表示不平衡。

研究背景与动机¶

半监督医学影像分割（SSMIS）的类不平衡问题：医学分割数据天然存在像素级长尾分布——大器官占据大量像素主导梯度更新，小器官训练不足
类不平衡 + 半监督的两重挑战：
监督信号偏差：大器官占更多像素导致梯度偏向头部类；自生成的伪标签和一致性约束进一步强化头部类学习
表示层不平衡：现有方法（重加权、输出校准）仅作用于损失或输出层，缺乏对类条件特征分布的直接约束，导致尾部类特征漂移到头部类区域
关键洞察：现有方法利用未标注数据主要做局部一致性正则化，很少用来显式修正类条件特征分布的偏斜

方法详解¶

SCDL 整体框架¶

即插即用模块，集成到现有分割网络中
充分利用标注数据提供语义监督，同时引导未标注数据在分布层面参与学习

1. 类分布双向对齐（CDBA）¶

类分布建模：每个语义类 c 用可学习的代理分布表示为 N(μ_c, diag(σ_c²))，均值和方差都是可训练参数

软分配：通过余弦相似度 + softmax 计算每个 token 嵌入对所有类代理的软分配概率 P(c|z)，允许每个嵌入关联多个类

双向对齐： - E2P（嵌入→代理）：加权余弦距离损失，鼓励嵌入靠近其软分配的代理分布 - P2E（代理→嵌入）：鼓励每个代理对其分配的嵌入有高相似度、对其他嵌入有低相似度，增强代理判别性

代理采样与特征丰富： - 分布加权先验：从代理分布采样 S 个样本，用采样相似度加权各类均值 - 中心相似度先验：直接用余弦相似度加权各类均值（忽略方差） - token 采样先验：对每个 token 做局部扰动采样 - 三个先验拼接后投影注入到解码器每层

2. 语义锚约束（SAC）¶

锚构建：用 ground-truth 掩码提取类特定区域，通过共享编码器得到类感知嵌入，平均后作为语义锚
锚对齐损失：余弦相似度约束每个类代理 μ_c 与其对应语义锚对齐
锚在反向传播时 detach，仅更新代理而不影响编码器
确保代理分布捕获真实类语义，防止被类频率偏差带偏

实验关键数据¶

数据集¶

Synapse：30 例 CT，13 个器官类别，20% 标注
AMOS：360 例 CT，15 个器官类别，5% 标注

Synapse (20% labeled)¶

方法	DSC↑	ASD↓
VNet (fully)	68.49	6.08
GA-CPS	66.29	5.44
SCDL-GA-CPS	67.50	3.32
GA-MagicNet	66.00	3.42
SCDL-GA-MagicNet	66.75	3.65

SCDL-GA-CPS 的 ASD 降低 2.12（5.44→3.32），边界质量显著提升

AMOS (5% labeled)¶

方法	DSC↑	ASD↓
GenericSSL	35.73	45.82
SCDL-GenericSSL	47.35 (+11.62)	22.84
DHC	40.11	40.65
SCDL-DHC	49.28 (+9.17)	17.47 (-23.18)
GA-MagicNet	59.15	8.66
SCDL-GA-MagicNet	62.16 (+3.01)	5.65

在标注更稀少的 AMOS 上提升更显著：SCDL-GenericSSL DSC +11.62%，SCDL-DHC ASD 从 40.65 骤降至 17.47

逐类 Dice 分析¶

对尾部类贡献尤为显著：如 Synapse 上 SCDL-GA-CPS 的胰腺（PA）从 45.5→49.4，右肾上腺（RAG）从 44.7→49.2
AMOS 上原本 Dice 为 0 的类（如 RAG/LAG 在 GenericSSL 和 DHC 中）在加入 SCDL 后获得非零 Dice

亮点¶

即插即用设计：SCDL 能无缝集成到多种半监督分割基线（GenericSSL、DHC、GA-MagicNet、GA-CPS），一致带来提升
表示层去偏：不同于损失/输出层操作，直接在嵌入空间学习类条件分布结构，从根本上解决表示偏倚
双向对齐机制：E2P + P2E 互补，既让嵌入靠近正确代理，又让代理具备判别性
语义锚引导：用标注数据为代理学习提供可靠的语义监督，防止代理发散
尾部类增益显著：在极端稀少标注下（5%），让原本完全失败的类别获得有意义的分割

局限性¶

代理分布假设为对角高斯，可能无法捕获复杂的多模态类条件分布
SAC 的语义锚依赖标注数据，在极少标注时锚的质量可能不稳定
三种先验（分布加权、中心相似度、token 采样）的拼接注入方式较为朴素，缺乏自适应融合
仅在 CT 数据集上验证，MRI 等其他模态的适用性未探讨
代理采样数 S 和投影维度等超参数的敏感性分析未充分展示

评分¶

新颖性: 4/5 — 类条件代理分布建模 + 双向对齐在半监督分割中是新颖且有洞察力的设计
实验充分度: 4/5 — 两个数据集、多个基线集成、逐类分析，但缺少消融实验详细展示
写作质量: 4/5 — 动机阐述清晰、方法描述严谨，图示直观
价值: 4/5 — 即插即用模块对实际医学分割场景有直接实用价值