CLoE: Expert Consistency Learning for Missing Modality Segmentation¶

会议: CVPR 2026 arXiv: 2603.09316 代码: 无领域: 医学图像 关键词: 缺失模态, 多模态分割, 一致性学习, 脑肿瘤分割, 可靠性门控

一句话总结¶

提出 CLoE（Consistency Learning of Experts），将缺失模态鲁棒性问题建模为决策层面的专家一致性控制，通过模态专家一致性（MEC）和区域专家一致性（REC）双分支约束减少专家漂移，并用一致性分数驱动的门控网络实现可靠性加权融合。

研究背景与动机¶

多模态 MRI 分割（如脑肿瘤）在临床中经常面临模态缺失（设备故障、扫描协议不同等）。现有方法的不足：

生成式方法（GAN 合成缺失模态）：生成质量不稳定，不可避免地引入伪影。
固定权重融合/注意力机制（如 SE、CBAM）：当缺失模态用零张量填充时，注意力机制变得无效——基于幅值的注意力对零输入无法产生有意义的权重。
一致性学习（如 Mean Teacher）：在体积 MRI 中受到背景占优问题的困扰——全局一致性可以在不对齐小肿瘤区域的情况下被满足。

核心矛盾：现有方法缺少一个明确的机制来判断"哪个模态专家在当前 case 和区域上应该被信任"。不同模态提供不平等的证据，但融合时没有区分。

CLoE 的切入角度：将缺失模态鲁棒性重新定义为决策层面的一致性问题——如果各模态专家的预测一致，那么融合结果就是稳定的；不一致说明某些专家不可靠，应降权。

方法详解¶

整体框架¶

CLoE 由三部分组成：(1) 并行模态编码器 \(\Phi_m\) 提取各模态特征；(2) 权重共享的专家解码器 \(D^{\text{sep}}\) 对每个模态独立预测分割；(3) 一致性驱动的门控模块将一致性分数转化为可靠性权重，加权融合后送入融合解码器 \(D^{\text{fuse}}\)。

关键设计¶

Modality Expert Consistency (MEC，模态专家一致性)：对所有可用模态对 \((a,b)\)，计算预测图的余弦相似度，强制全局分布对齐：\(\mathcal{L}_{\text{MEC}} = \frac{1}{|\mathcal{P}|}\sum_{(a,b)\in\mathcal{P}}(1 - \mathcal{S}(\mathbf{p}^{(a)}, \mathbf{p}^{(b)}))\)。设计动机：当某些模态缺失时，剩余专家如果预测不一致，融合就会放大错误。MEC 通过减少 case-wise drift 来提升鲁棒性。
Region Expert Consistency (REC，区域专家一致性)：全局一致性容易被背景像素主导，因此引入可学习的前景区域图 \(r = \sigma(\pi(\frac{1}{|\mathcal{A}|}\sum_{m\in\mathcal{A}}f_1^{(m)}))\)，对预测加权后再计算一致性：\(\mathcal{L}_{\text{REC}} = \frac{1}{|\mathcal{P}|}\sum_{(a,b)\in\mathcal{P}}(1 - \mathcal{S}(\mathbf{p}_r^{(a)}, \mathbf{p}_r^{(b)}))\)。设计动机：在脑肿瘤分割中，增强肿瘤（ET）区域体积很小，全局一致性对其基本无约束力，而 REC 专门强调前景区域的对齐。
Consistency-Driven Dynamic Gating（一致性驱动的动态门控）：对每个模态 \(m\)，计算其与其他专家的全局一致性 \(u_m\) 和区域一致性 \(v_m\)，送入轻量门控网络 \(\mathcal{G}\) 得到可靠性权重 \(w_m = \text{softmax}(\mathcal{G}(u_m, v_m))\)。多尺度特征按权重融合：\(f_\ell = \sum_m w_m \odot f_\ell^{(m)}\)。缺失模态权重自动为 0。设计动机：不一致的专家 = 不可靠，直接从一致性度量转化为融合权重，比基于特征幅值的注意力更合理。

损失函数 / 训练策略¶

总损失为三项之和：

\[\mathcal{L}_{\text{total}} = \mathcal{L}_{\text{seg}} + \alpha \mathcal{L}_{\text{ECL}} + \beta \mathcal{L}_{\text{contrast}}\]

\(\mathcal{L}_{\text{seg}}\)：融合特征的分割损失（WCE + Dice）
\(\mathcal{L}_{\text{ECL}}\)：各专家独立监督 + \(\eta(\mathcal{L}_{\text{MEC}} + \lambda_{\text{rec}}\mathcal{L}_{\text{REC}})\)
\(\mathcal{L}_{\text{contrast}}\)：对比表示学习损失（SSIM 对齐内容 + 余弦对齐风格 + KL 正则）

训练：Adam，lr=0.0002，weight decay=0.0001，500 epochs，batch size=1。训练时随机丢弃模态模拟缺失。

实验关键数据¶

主实验¶

BraTS 2020（15 种缺失模态组合，平均 Dice %）

区域	指标	CLoE	DC-Seg	M³AE	提升(vs DC-Seg)
WT	Avg Dice	88.09	87.54	86.90	+0.55
TC	Avg Dice	80.23	79.63	79.10	+0.60
ET	Avg Dice	65.06	65.00	61.70	+0.06

MSD Prostate PZ（3 种模态组合）

设置	CLoE	DC-Seg	RFNet
T2	80.33	79.21	75.18
ADC	77.12	75.89	72.07
T2&ADC	82.91	81.67	78.00
平均	80.12	79.59	77.35

消融实验¶

配置	WT Dice	TC Dice	ET Dice	说明
w/o MEC	87.75	80.01	63.50	全局一致性贡献适中
w/o REC	86.40	79.39	61.65	ET 下降 3.41%，区域一致性关键
w/o Gating	87.99	80.08	63.90	门控精调作用
w/o Weight Fusion	86.52	78.33	61.10	ET 下降 3.96%，融合最重要
CLoE (full)	88.09	80.23	65.06	—

关键发现¶

REC 和 Weight Fusion 是两个最关键组件，去掉任一个都导致 ET（最难的小区域）显著下降。
MEC 单独去掉影响较小，说明全局一致性提供的约束不如区域一致性精准。
单一模型即可处理所有 15 种缺失组合，无需为每种组合训练单独模型。

亮点与洞察¶

将缺失模态鲁棒性重新建模为一致性控制问题，概念清晰且可操作。
REC 的前景加权策略有效解决了背景占优问题，对小目标分割（ET）提升明显。
一致性→可靠性→融合权重的转化链条逻辑通畅，门控网络极轻量不增加推理负担。
跨数据集泛化：从 BraTS（4 模态）到 MSD Prostate（2 模态）都有效。

局限性 / 可改进方向¶

ET 的平均 Dice 仍然只有 65%，说明缺失模态下小目标分割仍是开放问题。
门控网络的输入只有两个标量（\(u_m, v_m\)），可能信息量有限，可考虑更丰富的特征。
只在 BraTS 和 Prostate 两个数据集上验证，其他器官/模态组合未被覆盖。
对比 MedSAM 对 bounding box 的依赖，并没有和 SAM-based 方法做完整对比。

评分¶

新颖性: ⭐⭐⭐⭐ 一致性→可靠性的 formulation 新颖，REC 解决了真实问题
实验充分度: ⭐⭐⭐ BraTS + Prostate 两个数据集足够但数量偏少
写作质量: ⭐⭐⭐⭐ 方法动机解释充分，ablation 设计合理
价值: ⭐⭐⭐⭐ 缺失模态是临床刚需，方法实用且概念清晰