跳转至

Unsupervised Domain Adaptation with Target-Only Margin Disparity Discrepancy

会议: CVPR 2026
arXiv: 2603.09932
领域: 医学图像
关键词: 无监督域自适应, Margin Disparity Discrepancy, CBCT, 肝脏分割, 介入影像
arXiv: 2603.09932
代码: 无
领域: 医学图像
关键词: 无监督域自适应, Margin Disparity Discrepancy, CBCT, 肝脏分割, 介入影像

一句话总结

针对 CT→CBCT 肝脏分割的无监督域自适应问题,发现经典 MDD 优化目标中存在矛盾项(源域上特征提取器被优化为最大化 \(f\)\(f'\) 的差异),提出 Target-Only MDD 改进,去除矛盾项并在两域上统一最小化预测差异,在 2D 和 3D 实验中均取得 UDA SOTA。

研究背景与动机

  • 临床背景:介入放射中 CBCT 可提供术中实时三维引导,自动肝脏分割对手术规划至关重要
  • 数据困境:CT 有大量公开标注数据集,但介入 CBCT 数据稀缺且无标注
  • 域差异来源
  • CBCT 的散射伪影、有限动态范围、重建几何差异
  • 动脉内造影增强导致肝脏内出现高亮区域
  • CBCT 视野有限,与 CT 视野不同
  • 现有方法局限
    • 基础模型(SAM-MED 2D/3D、MA-SAM):主要在自然图像上训练,泛化到 CBCT 效果有限
    • 图像对齐方法(SIFA):依赖相同视野假设,不适用于 CT/CBCT
    • 自训练方法(BDCL):在大域偏移下伪标签质量差
  • MDD 的问题:经典 MDD 在实际优化中,特征提取器 \(\psi\) 在源域上被优化为最大化 \(f\)\(f'\) 的差异(公式 3 红色框项),这与域对齐目标矛盾

方法详解

背景:经典 MDD

U-Net 分解为特征提取器 \(\psi\) + 分割头 \(f\) + 对抗分割头 \(f'\)。经典 MDD 优化:

\[\min_{f,\psi} \max_{f'} \mathcal{L}^{\text{task}}(f(z^S), y^S) + \alpha \mathcal{L}_{CE}(f'(z^T), f(z^T)) - \gamma \mathcal{L}_{CE}(f'(z^S), f(z^S))\]

问题:实际中 \(f\) 不参与差异项优化,\(\psi\) 在源域上被优化为最大化 \(f\)\(f'\) 差异(最后一项符号为负),这与需要在两域上对齐特征的目标矛盾。

Target-Only MDD(本文方法)

去除矛盾项,重新表述为三步交替优化:

步骤 1 — 优化分割头 \(f\): $\(\min_f L^{\text{task}}(f(z^S), y^S)\)$

步骤 2 — 优化对抗头 \(f'\): $\(\min_{f'} \left[ \mathcal{L}_{CE}(f'(z^S), f(z^S)) - \gamma \mathcal{L}_{CE}(f'(z^T), f(z^T)) \right]\)$

\(f'\) 在源域上模仿 \(f\),在目标域上偏离 \(f\)

步骤 3 — 优化特征提取器 \(\psi\): $\(\min_\psi \left[ L^{\text{task}}(f(z^S), y^S) + \alpha \mathcal{L}_{CE}(f'(z^S), f(z^S)) + \gamma \mathcal{L}_{CE}(f'(z^T), f(z^T)) \right]\)$

关键变化:\(\psi\)两个域上都最小化 \(f\)\(f'\) 的差异(源域项符号从减变加),消除矛盾。

Few-shot 扩展

UDA 训练后保留 \(f \circ \psi\),移除 \(f'\),用少量目标域标注样本微调。

实现细节

  • 骨干:U-Net,5 阶段,首阶段 64 通道
  • 超参:\(\alpha = 7.5 \times 10^{-2}\)\(\gamma = 3 \times 10^{-1}\)
  • 数据:573 例 CBCT + 678 例 CT,患者级分割

实验关键数据

2D CT→CBCT 肝脏分割

类型 方法 F1 (%)
Source Only U-Net 54.1
Foundation SAM-MED 2D (5pt) 67.7
Self-Training BDCL 60.0
Feature Align DANN 68.3
Feature Align MDD 70.0
Feature Align Ours 74.4
Few-shot Ours + 50 vol 84.6
上界 Target Only (100%) 85.5

3D CT→CBCT 肝脏分割

类型 方法 F1 (%)
Source Only U-Net 80.1
Foundation SAM-MED 3D (5pt) 65.3
Foundation MA-SAM 61.8
Image Align SIFA 64.7
Feature Align DANN 84.6
Feature Align Ours 86.6
Few-shot Ours + 5 vol 90.9
上界 Target Only (100%) 93.7

关键发现

  1. UDA 无标注即超越 5-shot 目标域训练:Ours (86.6%) > Target Only 5-vol (84.7%)
  2. Ours + 5 vol (90.9%) ≈ Target Only 20-vol (89.6%)
  3. 超参数鲁棒:不同 \(\alpha, \gamma\) 组合下性能稳定
  4. 方差最低:Ours 标准差 9.4%,远低于 MA-SAM (18.3%) 和 SAM-MED 3D (28.8%)

亮点与洞察

  1. 理论驱动的方法改进:通过分析 MDD 优化目标的矛盾项,提出简洁有效的修正,而非堆叠复杂模块
  2. 对基础模型的冷静审视:SAM-MED 在 CBCT 上表现远不及 UDA,说明医学域偏移问题仍需专门处理
  3. CBCT 特殊挑战的深入分析:造影增强导致的高亮区域使模型欠分割肝脏,本方法通过 3D 上下文信息有效缓解
  4. Few-shot 扩展自然:UDA 后少量标注即可达到接近全监督的性能

局限性

  • 仅在肝脏分割单一任务上验证,未扩展到其他器官或分割任务
  • 数据集为私有数据,无法复现
  • 2D 实验中未对比常见的 CycleGAN 等图像翻译方法
  • MDD 理论框架主要针对分类,在分割任务上的理论保证仍不完善

评分

维度 评分
新颖性 ⭐⭐⭐
实验 ⭐⭐⭐⭐
写作 ⭐⭐⭐⭐
价值 ⭐⭐⭐⭐

相关论文