Unsupervised Domain Adaptation with Target-Only Margin Disparity Discrepancy¶
会议: CVPR 2026
arXiv: 2603.09932
领域: 医学图像
关键词: 无监督域自适应, Margin Disparity Discrepancy, CBCT, 肝脏分割, 介入影像
arXiv: 2603.09932
代码: 无
领域: 医学图像
关键词: 无监督域自适应, Margin Disparity Discrepancy, CBCT, 肝脏分割, 介入影像
一句话总结¶
针对 CT→CBCT 肝脏分割的无监督域自适应问题,发现经典 MDD 优化目标中存在矛盾项(源域上特征提取器被优化为最大化 \(f\) 和 \(f'\) 的差异),提出 Target-Only MDD 改进,去除矛盾项并在两域上统一最小化预测差异,在 2D 和 3D 实验中均取得 UDA SOTA。
研究背景与动机¶
- 临床背景:介入放射中 CBCT 可提供术中实时三维引导,自动肝脏分割对手术规划至关重要
- 数据困境:CT 有大量公开标注数据集,但介入 CBCT 数据稀缺且无标注
- 域差异来源:
- CBCT 的散射伪影、有限动态范围、重建几何差异
- 动脉内造影增强导致肝脏内出现高亮区域
- CBCT 视野有限,与 CT 视野不同
- 现有方法局限:
- 基础模型(SAM-MED 2D/3D、MA-SAM):主要在自然图像上训练,泛化到 CBCT 效果有限
- 图像对齐方法(SIFA):依赖相同视野假设,不适用于 CT/CBCT
- 自训练方法(BDCL):在大域偏移下伪标签质量差
- MDD 的问题:经典 MDD 在实际优化中,特征提取器 \(\psi\) 在源域上被优化为最大化 \(f\) 和 \(f'\) 的差异(公式 3 红色框项),这与域对齐目标矛盾
方法详解¶
背景:经典 MDD¶
U-Net 分解为特征提取器 \(\psi\) + 分割头 \(f\) + 对抗分割头 \(f'\)。经典 MDD 优化:
问题:实际中 \(f\) 不参与差异项优化,\(\psi\) 在源域上被优化为最大化 \(f\) 和 \(f'\) 差异(最后一项符号为负),这与需要在两域上对齐特征的目标矛盾。
Target-Only MDD(本文方法)¶
去除矛盾项,重新表述为三步交替优化:
步骤 1 — 优化分割头 \(f\): $\(\min_f L^{\text{task}}(f(z^S), y^S)\)$
步骤 2 — 优化对抗头 \(f'\): $\(\min_{f'} \left[ \mathcal{L}_{CE}(f'(z^S), f(z^S)) - \gamma \mathcal{L}_{CE}(f'(z^T), f(z^T)) \right]\)$
\(f'\) 在源域上模仿 \(f\),在目标域上偏离 \(f\)。
步骤 3 — 优化特征提取器 \(\psi\): $\(\min_\psi \left[ L^{\text{task}}(f(z^S), y^S) + \alpha \mathcal{L}_{CE}(f'(z^S), f(z^S)) + \gamma \mathcal{L}_{CE}(f'(z^T), f(z^T)) \right]\)$
关键变化:\(\psi\) 在两个域上都最小化 \(f\) 和 \(f'\) 的差异(源域项符号从减变加),消除矛盾。
Few-shot 扩展¶
UDA 训练后保留 \(f \circ \psi\),移除 \(f'\),用少量目标域标注样本微调。
实现细节¶
- 骨干:U-Net,5 阶段,首阶段 64 通道
- 超参:\(\alpha = 7.5 \times 10^{-2}\),\(\gamma = 3 \times 10^{-1}\)
- 数据:573 例 CBCT + 678 例 CT,患者级分割
实验关键数据¶
2D CT→CBCT 肝脏分割¶
| 类型 | 方法 | F1 (%) |
|---|---|---|
| Source Only | U-Net | 54.1 |
| Foundation | SAM-MED 2D (5pt) | 67.7 |
| Self-Training | BDCL | 60.0 |
| Feature Align | DANN | 68.3 |
| Feature Align | MDD | 70.0 |
| Feature Align | Ours | 74.4 |
| Few-shot | Ours + 50 vol | 84.6 |
| 上界 | Target Only (100%) | 85.5 |
3D CT→CBCT 肝脏分割¶
| 类型 | 方法 | F1 (%) |
|---|---|---|
| Source Only | U-Net | 80.1 |
| Foundation | SAM-MED 3D (5pt) | 65.3 |
| Foundation | MA-SAM | 61.8 |
| Image Align | SIFA | 64.7 |
| Feature Align | DANN | 84.6 |
| Feature Align | Ours | 86.6 |
| Few-shot | Ours + 5 vol | 90.9 |
| 上界 | Target Only (100%) | 93.7 |
关键发现¶
- UDA 无标注即超越 5-shot 目标域训练:Ours (86.6%) > Target Only 5-vol (84.7%)
- Ours + 5 vol (90.9%) ≈ Target Only 20-vol (89.6%)
- 超参数鲁棒:不同 \(\alpha, \gamma\) 组合下性能稳定
- 方差最低:Ours 标准差 9.4%,远低于 MA-SAM (18.3%) 和 SAM-MED 3D (28.8%)
亮点与洞察¶
- 理论驱动的方法改进:通过分析 MDD 优化目标的矛盾项,提出简洁有效的修正,而非堆叠复杂模块
- 对基础模型的冷静审视:SAM-MED 在 CBCT 上表现远不及 UDA,说明医学域偏移问题仍需专门处理
- CBCT 特殊挑战的深入分析:造影增强导致的高亮区域使模型欠分割肝脏,本方法通过 3D 上下文信息有效缓解
- Few-shot 扩展自然:UDA 后少量标注即可达到接近全监督的性能
局限性¶
- 仅在肝脏分割单一任务上验证,未扩展到其他器官或分割任务
- 数据集为私有数据,无法复现
- 2D 实验中未对比常见的 CycleGAN 等图像翻译方法
- MDD 理论框架主要针对分类,在分割任务上的理论保证仍不完善
评分¶
| 维度 | 评分 |
|---|---|
| 新颖性 | ⭐⭐⭐ |
| 实验 | ⭐⭐⭐⭐ |
| 写作 | ⭐⭐⭐⭐ |
| 价值 | ⭐⭐⭐⭐ |
相关论文¶
- [CVPR 2026] Tell2Adapt: A Unified Framework for Source Free Unsupervised Domain Adaptation via Vision Foundation Model
- [CVPR 2026] Interpretable Cross-Domain Few-Shot Learning with Rectified Target-Domain Local Alignment
- [CVPR 2026] Adaptation of Weakly Supervised Localization in Histopathology by Debiasing Predictions
- [CVPR 2026] From Adaptation to Generalization: Adaptive Visual Prompting for Medical Image Segmentation
- [CVPR 2026] CHIPS: Efficient CLIP Adaptation via Curvature-aware Hybrid Influence-based Data Selection