SemiTooth: a Generalizable Semi-supervised Framework for Multi-Source Tooth Segmentation¶

会议: CVPR 2026 arXiv: 2603.11616 代码: 无领域: 医学图像 关键词: 牙齿分割, CBCT, 半监督学习, 多源数据, 多教师多学生

一句话总结¶

提出 SemiTooth 框架，通过多教师多学生架构和严格加权置信度约束（SWC），解决多源 CBCT 牙齿分割中的标注稀缺和跨源域间差异问题，同时构建了首个多源半监督牙齿数据集 MS3Toothset。

CBCT 牙齿结构分割是智能口腔诊疗的核心任务，但面临两大挑战：

标注数据稀缺：体素级标注耗时昂贵，大量去标识化 CBCT 数据未被利用
多源域间差异：不同机构/设备的 CBCT 数据在密度分布、强度分布和特征空间上存在显著差距（由 Kernel Density Estimation 和 t-SNE 可视化验证），导致模型跨源泛化困难

现有半监督医学分割方法（Mean Teacher、UA-MT、MCF 等）主要针对单源数据设计，缺乏跨源知识迁移能力。而多源方法（ASDA、Dual-Teacher）要么需要复杂网络或强监督，要么缺乏在多源 CBCT 牙齿数据上的验证。

SemiTooth 采用三学生+两教师的多分支架构。数据组织为三个子集： - Main（标注数据，来自主源） - Other（未标注数据，来自其他源） - Mixed（未标注数据，与主源分布相似，通过 Wasserstein 距离度量筛选）

每个子集由对应的学生网络处理，两个教师分别监督 Mixed 和 Other 学生，通过 EMA 更新：

\[\theta_t^{(k)} \leftarrow \gamma \theta_t^{(k-1)} + (1-\gamma) \theta_s^{(k)}, \quad \gamma = 0.99\]

解决 CBCT 异质性引入噪声导致一致性正则化退化的问题。SWC 融合区域级门控和体素级加权：

区域级门控：将样本均匀分为非重叠立方体区域 $\{r\}$，计算区域置信度 $c(r) = \mathbb{E}_{i \in r}[\max_c P^T_{i,c}]$，低于阈值 $\tau=0.9$ 的区域视为不可靠并丢弃
体素级加权：在保留区域内，用体素级置信度 $c_i = \max_c P^T_{i,c}$ 加权教师-学生对齐： $$\mathcal{SWC}(P^S, P^T) = \mathbb{E}_{r \in \mathcal{R}_\tau}\left[\mathbb{E}_{i \in r}\left[c_i \cdot \mathcal{A}(P^S_i, P^T_i)\right]\right]$$
该设计特别适合 3D CBCT 数据：区域级过滤利用了体积数据的空间连续性
多源数据集 MS3Toothset：
收集三个来源：ShanghaiTech（公开、有标注）、PKU-SS 和 AFMC（私有、无标注）
经过筛选处理后包含 98 个标注样本（20 个测试）和 438 个未标注样本
首个面向多源半监督牙齿分割的综合数据集

总损失结合监督损失和两个 SWC 一致性损失：

\[\mathcal{L}_{total} = \mathcal{L}_{sup} + \alpha \mathcal{L}_{cons}^u + \beta \mathcal{L}_{cons}^h, \quad \alpha = \beta = 0.5\]

方法	mIoU	Dice	Recall	Acc
V-Net (全监督基线)	61.36	73.65	70.77	66.75
Mean Teacher	67.69	78.72	78.06	73.68
UA-MT	68.37	79.18	80.42	76.17
ASDA	73.75	83.63	80.93	78.79
CMT	76.14	85.07	87.14	84.32
Uni-HSSL	75.76	85.42	84.26	81.88
SemiTooth	76.67	85.69	88.66	86.44

Exp	模块组合	mIoU	Dice	Recall	Acc
1	V-Net	61.36	73.65	70.77	66.75
2	+ Mean Teacher	67.69	78.72	78.06	73.68
3	+ SWC (无 SemiTooth)	69.94	80.29	79.67	75.34
4	+ SemiTooth (无 SWC)	75.37	84.56	83.07	80.48
5	+ SemiTooth + SWC	76.67	85.69	88.66	86.44