SemiTooth: a Generalizable Semi-supervised Framework for Multi-Source Tooth Segmentation¶

会议: CVPR 2026
arXiv: 2603.11616
代码: 无
领域: 医学图像分割 / 牙科CBCT
关键词: 牙齿分割, 半监督学习, 多源数据, 伪标签过滤, CBCT

一句话总结¶

提出SemiTooth——多教师多学生半监督框架+更严格加权置信度约束(SWC)，用于多源CBCT牙齿分割，在新构建的MS3Toothset上mIoU达76.67%、Dice 85.69%，超越SOTA CMT(76.14%)。

背景与动机¶

基于CBCT的牙齿分割对牙科诊断至关重要，但体素级标注昂贵且跨机构泛化性差。多源CBCT数据存在显著分布差异（密度、强度、特征空间），而现有半监督方法仅面向单源场景。公开的多源CBCT牙齿数据集极为稀缺。

核心问题¶

如何有效利用分布差异大的多源CBCT未标注数据，在仅有有限单源标注的条件下实现可泛化的牙齿分割？

方法详解¶

整体框架¶

三个学生分配到主(标注)/混合(相似未标注)/其他(不相似未标注)子集。两个教师通过EMA更新提供伪标签监督混合/其他学生。V-Net backbone共享。

关键设计¶

多教师多学生架构: 用Wasserstein距离衡量分布相似性，将数据源重构为主/混合/其他子集。每个学生学习源特异知识；教师提供稳定伪标签。学生共享架构确保知识迁移。
更严格加权置信度(SWC)约束: 将预测分为不重叠立方体区域；过滤平均置信度\(c(r) < \tau\)(=0.9)的区域。有效区域内，体素级置信度加权教师-学生对齐损失——同时在区域级和体素级做可靠性过滤。
MS3Toothset数据集: 来自3个源(上海科技+北大+AFMC)的多源半监督牙齿数据集，98标注(20测试)+438未标注。首个公开构建的多源CBCT牙齿基准。

损失函数 / 训练策略¶

\(\mathcal{L}_{total} = \mathcal{L}_{sup} + 0.5\mathcal{L}_{cons}^u + 0.5\mathcal{L}_{cons}^h\)。Adam, lr=0.0001, 300 epochs, EMA decay 0.99, batch 4, 4×A4500。

实验关键数据¶

方法	mIoU	Dice	Recall
SemiTooth	76.67	85.69	88.66
CMT(SOTA)	76.14	85.07	87.14
V-Net(基线)	61.36	73.65	70.77

消融实验要点¶

MT+SWC: mIoU 69.94%(+2.25% vs MT alone)——SWC减少噪声边缘
ST无SWC: mIoU 75.37%(+7.68% vs MT)——多教师多学生架构有效
全模型ST+SWC: mIoU 76.67%, Recall 88.66% vs MT 78.06%——协同提升

亮点¶

首个多源半监督CBCT牙齿分割框架
构建了新的MS3Toothset多源基准
SWC在区域级+体素级双重可靠性过滤

局限性 / 可改进方向¶

仅98标注样本+3个源，规模有限
比CMT提升边际(+0.53% mIoU)
仅在自建MS3Toothset上测试，无跨数据集评估

与相关工作的对比¶

CMT(ACM MM 24): 协同训练Mean Teacher, 76.14% → 本文76.67%
Uni-HSSL(CVPR 25): 统一异构半监督, 75.76% → 本文76.67%

评分¶

新颖性: ⭐⭐⭐ 多教师多学生+SWC设计合理但各组件不算新
实验充分度: ⭐⭐⭐⭐ 系统消融+数据集构建
写作质量: ⭐⭐⭐⭐ 问题定义清晰
价值: ⭐⭐⭐⭐ 构建新基准+解决实际牙科分割需求