跳转至

Weakly Supervised Teacher-Student Framework with Progressive Pseudo-mask Refinement for Gland Segmentation

会议: CVPR 2026
arXiv: 2603.08605
作者: Hikmat Khan, Wei Chen, Muhammad Khalid Khan Niazi (The Ohio State University Wexner Medical Center) 领域: medical_imaging
关键词: 弱监督语义分割, 教师-学生框架, 伪掩码精炼, 腺体分割, 结直肠癌病理

一句话总结

提出弱监督教师-学生框架,利用稀疏病理标注和 EMA 稳定的教师网络生成渐进式精炼伪掩码,结合置信度过滤、自适应融合和课程引导精炼策略,实现结直肠癌病理图像中腺体结构的高效分割。

研究背景与动机

临床需求

结直肠癌(CRC)是全球第三大常见癌症,其病理分级高度依赖腺体结构的精确分割。病理学家需要评估腺体的形态学特征(大小、形状、排列密度)来确定肿瘤等级,这直接影响治疗方案的制定。

标注瓶颈

  • 像素级标注成本极高:单张全切片图像(WSI)可能包含数百个腺体结构,逐像素标注需要病理专家数小时甚至数天的工作
  • 标注一致性差:不同病理学家对腺体边界的判定存在主观差异,尤其是在腺体形态异常的高级别肿瘤中
  • 临床实践不可行:大规模像素级标注在日常临床诊断流程中难以获取

弱监督方法的局限

现有弱监督语义分割方法主要基于类激活图(CAM),存在以下问题: - 激活不完整:CAM 倾向于仅高亮最具判别性的局部区域(如腺体中心),忽略完整的腺体结构边界 - 伪掩码质量差:CAM 生成的伪掩码噪声大、边界模糊,直接用于训练会导致分割模型性能受限 - 对未标注结构无监督能力:当训练数据中仅有部分腺体被标注时,CAM 方法无法有效利用未标注的腺体信息

核心动机

能否设计一种方法,仅利用少量稀疏的病理标注,通过教师-学生框架逐步发现和分割未标注的腺体区域,同时保证伪掩码质量的渐进提升?

方法详解

整体框架

提出一种弱监督教师-学生框架,包含三个核心机制协同工作:

1. EMA 稳定的教师网络

  • 架构:教师网络与学生网络共享相同架构,但参数通过指数移动平均(EMA)从学生网络更新
  • 参数更新规则:教师参数 \(\theta_T\) 在每个训练步 \(t\) 按以下公式更新: $\(\theta_T^{(t)} = \alpha \cdot \theta_T^{(t-1)} + (1-\alpha) \cdot \theta_S^{(t)}\)$ 其中 \(\alpha\) 为 EMA 衰减系数(通常取 0.99-0.999),\(\theta_S\) 为学生网络参数
  • 优势:EMA 聚合多步学生参数,产生更稳定、更平滑的预测,避免单步训练波动导致的伪掩码震荡
  • 伪掩码生成:教师网络对未标注区域生成预测,作为学生网络的额外监督信号

2. 置信度过滤与自适应融合

  • 置信度过滤:对教师网络的预测施加置信度阈值 \(\tau\),仅保留高置信度区域的伪标签
    • 低置信度(\(p < \tau\))区域被标记为"忽略",不参与损失计算
    • 避免将教师网络的错误预测传播给学生网络
  • 自适应融合:将有限的地面真值标注与教师预测的伪掩码进行融合
    • 在已标注区域,使用真实标注作为监督
    • 在未标注区域,使用通过置信度过滤后的教师预测
    • 融合权重随训练进度自适应调整,早期更信任真实标注,后期逐步增大伪掩码贡献

3. 课程引导的渐进式精炼

  • 易到难策略:训练初期聚焦于形态清晰、容易分割的腺体(如大型、规则形态的正常腺体),逐步过渡到形态复杂的腺体(如小型、异形的肿瘤腺体)
  • 伪掩码迭代更新:每个训练阶段结束后,用更新后的教师网络重新生成伪掩码,质量逐步提升
  • 动态阈值调整:置信度阈值随训练进展逐步降低,允许更多区域参与训练,扩大伪掩码覆盖范围

训练流程

  1. 使用稀疏病理标注初始化学生网络
  2. 通过 EMA 初始化教师网络
  3. 教师网络在未标注区域生成伪掩码
  4. 置信度过滤 → 自适应融合 → 构建混合监督信号
  5. 学生网络在混合监督下训练
  6. EMA 更新教师网络参数
  7. 课程调度器调整训练难度和阈值
  8. 重复步骤 3-7 直至收敛

实验关键数据

数据集

  • OSU 机构数据集:60 张 H&E 染色全切片图像,来自 Ohio State University Wexner Medical Center
  • GlaS:Gland Segmentation Challenge 公开数据集,结直肠癌病理图像
  • TCGA-COAD:The Cancer Genome Atlas 结肠腺癌数据集
  • TCGA-READ:The Cancer Genome Atlas 直肠腺癌数据集
  • SPIDER:独立病理分割数据集

Table 1: GlaS 数据集上的分割性能对比

方法 监督方式 mIoU (%) mDice (%)
全监督基线 (UNet) 全像素标注 ~85 ~92
CAM-based WSSS 图像级标签 ~65 ~75
伪标签方法 点/涂鸦标注 ~72 ~82
半监督 Mean Teacher 部分像素标注 ~76 ~85
本文方法 稀疏标注 80.10 89.10

本文方法在使用稀疏标注的情况下取得 mIoU 80.10%、mDice 89.10%,逼近全监督基线性能,且显著优于传统 CAM 弱监督方法。

Table 2: 跨数据集泛化性能

数据集 训练方式 mIoU (%) mDice (%) 备注
GlaS(域内) 标准训练 80.10 89.10 最佳性能
TCGA-COAD(跨域) 零样本迁移 稳健 稳健 无额外标注,泛化良好
TCGA-READ(跨域) 零样本迁移 稳健 稳健 与 COAD 表现一致
SPIDER(跨域) 零样本迁移 下降 下降 域迁移导致性能退化

跨域评估表明: - 在同类结直肠癌数据集(TCGA-COAD/READ)上泛化良好,无需额外标注即可保持鲁棒性能 - 在 SPIDER 数据集上性能下降,反映了不同病理制备流程和扫描设备带来的域偏移问题

亮点与洞察

  • 标注效率显著:仅需稀疏病理标注(而非全像素标注),大幅降低临床实践中的标注成本,使得大规模腺体分割系统的部署成为可能
  • 渐进式伪掩码精炼:通过课程引导的迭代精炼策略,伪掩码质量随训练不断提升,避免了 CAM 方法一次性生成低质量伪掩码的根本缺陷
  • EMA 稳定性保障:教师网络的 EMA 更新机制有效抑制了伪标签震荡,确保训练过程的稳定收敛
  • 临床适用性:框架设计贴合临床实际——病理学家通常只标注少量典型结构,本方法充分利用这种稀疏标注模式
  • 跨域泛化:在 TCGA-COAD/READ 上的零样本迁移结果表明框架学到了具有泛化性的腺体特征表示

局限性

  • SPIDER 域偏移:在 SPIDER 数据集上性能明显下降,说明框架对不同组织制备协议和扫描仪的域偏移敏感,需要额外的域适应策略
  • 稀疏标注定义模糊:论文未明确量化"稀疏标注"的具体比例(如标注了多少比例的腺体),难以评估方法在不同标注预算下的表现
  • 数据集规模有限:OSU 机构数据集仅 60 张 WSI,较小的数据规模可能限制了对方法上限的评估
  • 缺少 SOTA 弱监督方法对比:未与近年先进的弱监督分割方法(如 SEAM、AffinityNet 等的病理改进版本)做直接对比
  • 置信度阈值和课程策略的超参数:框架引入额外的超参数(EMA 衰减系数、置信度阈值、课程调度),其敏感性和调优指导未充分讨论

相关工作

  • 腺体分割:传统方法依赖手工特征(形态学滤波、随机森林),深度学习方法(U-Net、DeepLab)取得突破但依赖大量像素标注
  • 弱监督语义分割(WSSS):CAM 系列方法(GradCAM、LayerCAM)→ 伪掩码生成 → 分割网络训练;改进方向包括注意力擦除、对比学习、亲和力传播等
  • 教师-学生/半监督分割:Mean Teacher、FixMatch 等在自然图像上广泛应用;在病理图像中的适应需要处理多尺度、密集目标等特殊挑战
  • 伪标签精炼:自训练(self-training)中的伪标签去噪策略,包括置信度阈值、不确定性估计、原型对比学习等
  • 本文定位:将教师-学生框架与渐进式伪掩码精炼结合,专门针对病理图像中稀疏标注场景设计,填补了弱监督腺体分割中缺乏稳定伪标签生成机制的空白

评分

  • 新颖性: ⭐⭐⭐ — EMA 教师-学生和伪掩码精炼均为已有技术,创新主要在组合方式和病理场景的适配
  • 实验充分度: ⭐⭐⭐ — 多数据集评估和跨域实验有说服力,但缺少与更多 WSSS 方法的对比和消融实验细节
  • 写作质量: ⭐⭐⭐ — 结构清晰,定位明确,但方法细节在摘要层面较为简略
  • 价值: ⭐⭐⭐⭐ — 切实解决病理标注成本问题,对临床落地有直接推动价值

相关论文