Weakly Supervised Teacher-Student Framework with Progressive Pseudo-mask Refinement for Gland Segmentation¶

会议: CVPR 2026
arXiv: 2603.08605
作者: Hikmat Khan, Wei Chen, Muhammad Khalid Khan Niazi (The Ohio State University Wexner Medical Center) 领域: medical_imaging
关键词: 弱监督语义分割, 教师-学生框架, 伪掩码精炼, 腺体分割, 结直肠癌病理

一句话总结¶

提出弱监督教师-学生框架，利用稀疏病理标注和 EMA 稳定的教师网络生成渐进式精炼伪掩码，结合置信度过滤、自适应融合和课程引导精炼策略，实现结直肠癌病理图像中腺体结构的高效分割。

研究背景与动机¶

临床需求¶

结直肠癌（CRC）是全球第三大常见癌症，其病理分级高度依赖腺体结构的精确分割。病理学家需要评估腺体的形态学特征（大小、形状、排列密度）来确定肿瘤等级，这直接影响治疗方案的制定。

标注瓶颈¶

像素级标注成本极高：单张全切片图像（WSI）可能包含数百个腺体结构，逐像素标注需要病理专家数小时甚至数天的工作
标注一致性差：不同病理学家对腺体边界的判定存在主观差异，尤其是在腺体形态异常的高级别肿瘤中
临床实践不可行：大规模像素级标注在日常临床诊断流程中难以获取

弱监督方法的局限¶

现有弱监督语义分割方法主要基于类激活图（CAM），存在以下问题： - 激活不完整：CAM 倾向于仅高亮最具判别性的局部区域（如腺体中心），忽略完整的腺体结构边界 - 伪掩码质量差：CAM 生成的伪掩码噪声大、边界模糊，直接用于训练会导致分割模型性能受限 - 对未标注结构无监督能力：当训练数据中仅有部分腺体被标注时，CAM 方法无法有效利用未标注的腺体信息

核心动机¶

能否设计一种方法，仅利用少量稀疏的病理标注，通过教师-学生框架逐步发现和分割未标注的腺体区域，同时保证伪掩码质量的渐进提升？

方法详解¶

整体框架¶

提出一种弱监督教师-学生框架，包含三个核心机制协同工作：

1. EMA 稳定的教师网络¶

架构：教师网络与学生网络共享相同架构，但参数通过指数移动平均（EMA）从学生网络更新
参数更新规则：教师参数 $\theta_T$ 在每个训练步 $t$ 按以下公式更新： $$\theta_T^{(t)} = \alpha \cdot \theta_T^{(t-1)} + (1-\alpha) \cdot \theta_S^{(t)}$$ 其中 $\alpha$ 为 EMA 衰减系数（通常取 0.99-0.999），$\theta_S$ 为学生网络参数
优势：EMA 聚合多步学生参数，产生更稳定、更平滑的预测，避免单步训练波动导致的伪掩码震荡
伪掩码生成：教师网络对未标注区域生成预测，作为学生网络的额外监督信号

2. 置信度过滤与自适应融合¶

置信度过滤：对教师网络的预测施加置信度阈值 $\tau$，仅保留高置信度区域的伪标签
- 低置信度（$p < \tau$）区域被标记为"忽略"，不参与损失计算
- 避免将教师网络的错误预测传播给学生网络
自适应融合：将有限的地面真值标注与教师预测的伪掩码进行融合
- 在已标注区域，使用真实标注作为监督
- 在未标注区域，使用通过置信度过滤后的教师预测
- 融合权重随训练进度自适应调整，早期更信任真实标注，后期逐步增大伪掩码贡献

3. 课程引导的渐进式精炼¶

易到难策略：训练初期聚焦于形态清晰、容易分割的腺体（如大型、规则形态的正常腺体），逐步过渡到形态复杂的腺体（如小型、异形的肿瘤腺体）
伪掩码迭代更新：每个训练阶段结束后，用更新后的教师网络重新生成伪掩码，质量逐步提升
动态阈值调整：置信度阈值随训练进展逐步降低，允许更多区域参与训练，扩大伪掩码覆盖范围

训练流程¶

使用稀疏病理标注初始化学生网络
通过 EMA 初始化教师网络
教师网络在未标注区域生成伪掩码
置信度过滤 → 自适应融合 → 构建混合监督信号
学生网络在混合监督下训练
EMA 更新教师网络参数
课程调度器调整训练难度和阈值
重复步骤 3-7 直至收敛

实验关键数据¶

数据集¶

OSU 机构数据集：60 张 H&E 染色全切片图像，来自 Ohio State University Wexner Medical Center
GlaS：Gland Segmentation Challenge 公开数据集，结直肠癌病理图像
TCGA-COAD：The Cancer Genome Atlas 结肠腺癌数据集
TCGA-READ：The Cancer Genome Atlas 直肠腺癌数据集
SPIDER：独立病理分割数据集

Table 1: GlaS 数据集上的分割性能对比¶

方法	监督方式	mIoU (%)	mDice (%)
全监督基线 (UNet)	全像素标注	~85	~92
CAM-based WSSS	图像级标签	~65	~75
伪标签方法	点/涂鸦标注	~72	~82
半监督 Mean Teacher	部分像素标注	~76	~85
本文方法	稀疏标注	80.10	89.10

本文方法在使用稀疏标注的情况下取得 mIoU 80.10%、mDice 89.10%，逼近全监督基线性能，且显著优于传统 CAM 弱监督方法。

Table 2: 跨数据集泛化性能¶

数据集	训练方式	mIoU (%)	mDice (%)	备注
GlaS（域内）	标准训练	80.10	89.10	最佳性能
TCGA-COAD（跨域）	零样本迁移	稳健	稳健	无额外标注，泛化良好
TCGA-READ（跨域）	零样本迁移	稳健	稳健	与 COAD 表现一致
SPIDER（跨域）	零样本迁移	下降	下降	域迁移导致性能退化

跨域评估表明： - 在同类结直肠癌数据集（TCGA-COAD/READ）上泛化良好，无需额外标注即可保持鲁棒性能 - 在 SPIDER 数据集上性能下降，反映了不同病理制备流程和扫描设备带来的域偏移问题

亮点与洞察¶

标注效率显著：仅需稀疏病理标注（而非全像素标注），大幅降低临床实践中的标注成本，使得大规模腺体分割系统的部署成为可能
渐进式伪掩码精炼：通过课程引导的迭代精炼策略，伪掩码质量随训练不断提升，避免了 CAM 方法一次性生成低质量伪掩码的根本缺陷
EMA 稳定性保障：教师网络的 EMA 更新机制有效抑制了伪标签震荡，确保训练过程的稳定收敛
临床适用性：框架设计贴合临床实际——病理学家通常只标注少量典型结构，本方法充分利用这种稀疏标注模式
跨域泛化：在 TCGA-COAD/READ 上的零样本迁移结果表明框架学到了具有泛化性的腺体特征表示

局限性¶

SPIDER 域偏移：在 SPIDER 数据集上性能明显下降，说明框架对不同组织制备协议和扫描仪的域偏移敏感，需要额外的域适应策略
稀疏标注定义模糊：论文未明确量化"稀疏标注"的具体比例（如标注了多少比例的腺体），难以评估方法在不同标注预算下的表现
数据集规模有限：OSU 机构数据集仅 60 张 WSI，较小的数据规模可能限制了对方法上限的评估
缺少 SOTA 弱监督方法对比：未与近年先进的弱监督分割方法（如 SEAM、AffinityNet 等的病理改进版本）做直接对比
置信度阈值和课程策略的超参数：框架引入额外的超参数（EMA 衰减系数、置信度阈值、课程调度），其敏感性和调优指导未充分讨论

评分¶

新颖性: ⭐⭐⭐ — EMA 教师-学生和伪掩码精炼均为已有技术，创新主要在组合方式和病理场景的适配
实验充分度: ⭐⭐⭐ — 多数据集评估和跨域实验有说服力，但缺少与更多 WSSS 方法的对比和消融实验细节
写作质量: ⭐⭐⭐ — 结构清晰，定位明确，但方法细节在摘要层面较为简略
价值: ⭐⭐⭐⭐ — 切实解决病理标注成本问题，对临床落地有直接推动价值