跳转至

SemiTooth: a Generalizable Semi-supervised Framework for Multi-Source Tooth Segmentation

会议: CVPR 2026
arXiv: 2603.11616
代码: 无
领域: 医学图像分割 / 牙科CBCT
关键词: 牙齿分割, 半监督学习, 多源数据, 伪标签过滤, CBCT

一句话总结

提出SemiTooth——多教师多学生半监督框架+更严格加权置信度约束(SWC),用于多源CBCT牙齿分割,在新构建的MS3Toothset上mIoU达76.67%、Dice 85.69%,超越SOTA CMT(76.14%)。

背景与动机

基于CBCT的牙齿分割对牙科诊断至关重要,但体素级标注昂贵且跨机构泛化性差。多源CBCT数据存在显著分布差异(密度、强度、特征空间),而现有半监督方法仅面向单源场景。公开的多源CBCT牙齿数据集极为稀缺。

核心问题

如何有效利用分布差异大的多源CBCT未标注数据,在仅有有限单源标注的条件下实现可泛化的牙齿分割?

方法详解

整体框架

三个学生分配到主(标注)/混合(相似未标注)/其他(不相似未标注)子集。两个教师通过EMA更新提供伪标签监督混合/其他学生。V-Net backbone共享。

关键设计

  1. 多教师多学生架构: 用Wasserstein距离衡量分布相似性,将数据源重构为主/混合/其他子集。每个学生学习源特异知识;教师提供稳定伪标签。学生共享架构确保知识迁移。

  2. 更严格加权置信度(SWC)约束: 将预测分为不重叠立方体区域;过滤平均置信度\(c(r) < \tau\)(=0.9)的区域。有效区域内,体素级置信度加权教师-学生对齐损失——同时在区域级和体素级做可靠性过滤。

  3. MS3Toothset数据集: 来自3个源(上海科技+北大+AFMC)的多源半监督牙齿数据集,98标注(20测试)+438未标注。首个公开构建的多源CBCT牙齿基准。

损失函数 / 训练策略

\(\mathcal{L}_{total} = \mathcal{L}_{sup} + 0.5\mathcal{L}_{cons}^u + 0.5\mathcal{L}_{cons}^h\)。Adam, lr=0.0001, 300 epochs, EMA decay 0.99, batch 4, 4×A4500。

实验关键数据

方法 mIoU Dice Recall
SemiTooth 76.67 85.69 88.66
CMT(SOTA) 76.14 85.07 87.14
V-Net(基线) 61.36 73.65 70.77

消融实验要点

  • MT+SWC: mIoU 69.94%(+2.25% vs MT alone)——SWC减少噪声边缘
  • ST无SWC: mIoU 75.37%(+7.68% vs MT)——多教师多学生架构有效
  • 全模型ST+SWC: mIoU 76.67%, Recall 88.66% vs MT 78.06%——协同提升

亮点

  • 首个多源半监督CBCT牙齿分割框架
  • 构建了新的MS3Toothset多源基准
  • SWC在区域级+体素级双重可靠性过滤

局限性 / 可改进方向

  • 仅98标注样本+3个源,规模有限
  • 比CMT提升边际(+0.53% mIoU)
  • 仅在自建MS3Toothset上测试,无跨数据集评估

与相关工作的对比

  • CMT(ACM MM 24): 协同训练Mean Teacher, 76.14% → 本文76.67%
  • Uni-HSSL(CVPR 25): 统一异构半监督, 75.76% → 本文76.67%

评分

  • 新颖性: ⭐⭐⭐ 多教师多学生+SWC设计合理但各组件不算新
  • 实验充分度: ⭐⭐⭐⭐ 系统消融+数据集构建
  • 写作质量: ⭐⭐⭐⭐ 问题定义清晰
  • 价值: ⭐⭐⭐⭐ 构建新基准+解决实际牙科分割需求