SemiTooth: a Generalizable Semi-supervised Framework for Multi-Source Tooth Segmentation¶
会议: CVPR 2026
arXiv: 2603.11616
代码: 无
领域: 医学图像分割 / 牙科CBCT
关键词: 牙齿分割, 半监督学习, 多源数据, 伪标签过滤, CBCT
一句话总结¶
提出SemiTooth——多教师多学生半监督框架+更严格加权置信度约束(SWC),用于多源CBCT牙齿分割,在新构建的MS3Toothset上mIoU达76.67%、Dice 85.69%,超越SOTA CMT(76.14%)。
背景与动机¶
基于CBCT的牙齿分割对牙科诊断至关重要,但体素级标注昂贵且跨机构泛化性差。多源CBCT数据存在显著分布差异(密度、强度、特征空间),而现有半监督方法仅面向单源场景。公开的多源CBCT牙齿数据集极为稀缺。
核心问题¶
如何有效利用分布差异大的多源CBCT未标注数据,在仅有有限单源标注的条件下实现可泛化的牙齿分割?
方法详解¶
整体框架¶
三个学生分配到主(标注)/混合(相似未标注)/其他(不相似未标注)子集。两个教师通过EMA更新提供伪标签监督混合/其他学生。V-Net backbone共享。
关键设计¶
-
多教师多学生架构: 用Wasserstein距离衡量分布相似性,将数据源重构为主/混合/其他子集。每个学生学习源特异知识;教师提供稳定伪标签。学生共享架构确保知识迁移。
-
更严格加权置信度(SWC)约束: 将预测分为不重叠立方体区域;过滤平均置信度\(c(r) < \tau\)(=0.9)的区域。有效区域内,体素级置信度加权教师-学生对齐损失——同时在区域级和体素级做可靠性过滤。
-
MS3Toothset数据集: 来自3个源(上海科技+北大+AFMC)的多源半监督牙齿数据集,98标注(20测试)+438未标注。首个公开构建的多源CBCT牙齿基准。
损失函数 / 训练策略¶
\(\mathcal{L}_{total} = \mathcal{L}_{sup} + 0.5\mathcal{L}_{cons}^u + 0.5\mathcal{L}_{cons}^h\)。Adam, lr=0.0001, 300 epochs, EMA decay 0.99, batch 4, 4×A4500。
实验关键数据¶
| 方法 | mIoU | Dice | Recall |
|---|---|---|---|
| SemiTooth | 76.67 | 85.69 | 88.66 |
| CMT(SOTA) | 76.14 | 85.07 | 87.14 |
| V-Net(基线) | 61.36 | 73.65 | 70.77 |
消融实验要点¶
- MT+SWC: mIoU 69.94%(+2.25% vs MT alone)——SWC减少噪声边缘
- ST无SWC: mIoU 75.37%(+7.68% vs MT)——多教师多学生架构有效
- 全模型ST+SWC: mIoU 76.67%, Recall 88.66% vs MT 78.06%——协同提升
亮点¶
- 首个多源半监督CBCT牙齿分割框架
- 构建了新的MS3Toothset多源基准
- SWC在区域级+体素级双重可靠性过滤
局限性 / 可改进方向¶
- 仅98标注样本+3个源,规模有限
- 比CMT提升边际(+0.53% mIoU)
- 仅在自建MS3Toothset上测试,无跨数据集评估
与相关工作的对比¶
- CMT(ACM MM 24): 协同训练Mean Teacher, 76.14% → 本文76.67%
- Uni-HSSL(CVPR 25): 统一异构半监督, 75.76% → 本文76.67%
评分¶
- 新颖性: ⭐⭐⭐ 多教师多学生+SWC设计合理但各组件不算新
- 实验充分度: ⭐⭐⭐⭐ 系统消融+数据集构建
- 写作质量: ⭐⭐⭐⭐ 问题定义清晰
- 价值: ⭐⭐⭐⭐ 构建新基准+解决实际牙科分割需求