Multimodal Classification of Radiation-Induced Contrast Enhancements and Tumor Recurrence Using Deep Learning¶

会议: CVPR 2026
arXiv: 2603.11827
代码: 无（未公开）
领域: 医学图像 / 脑肿瘤分类 / 多模态融合
关键词: 胶质母细胞瘤, 放射性对比增强(RICE), 多模态MRI, 放疗剂量图, 3D ResNet

一句话总结¶

提出RICE-NET，一种多模态3D ResNet-18模型，融合纵向T1加权MRI数据与放射治疗剂量分布图，在92例胶质母细胞瘤患者队列上实现F1=0.92的RICE vs 肿瘤复发自动分类，消融实验揭示放疗剂量图是最具信息量的单模态输入。

背景与动机¶

胶质母细胞瘤(GBM)是最恶性的脑肿瘤，标准治疗包括手术切除+放疗。治疗后随访MRI中出现的新增或进展性对比增强病灶面临关键诊断困境：究竟是肿瘤复发(需要再次治疗)还是放射引起的对比增强(RICE，属于治疗副反应)？两者在MRI上表现相似。目前的临床工作流程依赖多学科肿瘤委员会的复杂评估，需要重新审阅从术后到放疗到随访的完整影像轨迹，耗时且主观。已有研究使用扩散MRI进行鉴别，但扩散MRI在临床中并非常规采集。同时，放射治疗剂量分布图虽然在肿瘤委员会讨论中越来越受关注，但现有方法很少将其纳入分类模型。

核心问题¶

如何利用临床常规可用的T1加权MRI和放疗剂量图，自动区分治疗后GBM患者的RICE与肿瘤复发？特别是：各模态（术后MRI、事件MRI、剂量图）对分类的贡献分别有多大？

方法详解¶

整体框架¶

RICE-NET基于3D ResNet-18架构（使用MONAI框架实现），将多模态输入沿通道维度拼接后输入网络进行二分类。输入可包括三种3D体积数据：(1) 术后T1加权对比增强MRI (MRI post-OP)，作为放疗规划的基线；(2) 事件MRI (MRI event)，即出现新增对比增强时的T1加权MRI；(3) 放射治疗剂量分布图(RD map)，记录了放疗过程中的空间剂量分布。

关键设计¶

数据预处理流水线: 所有体积数据经过统一预处理——重采样为等距体素间距，使用ANTs进行配准，HD-BET进行颅骨剥离，z-score强度归一化，最终裁剪为224×224×224体素（以大脑为中心）。对于仅有单次放疗分数的患者，通过分数数缩放计算总剂量。
3D ResNet-18架构: 将2D ResNet设计扩展到3D，包含初始3D卷积层+四个残差块+BN+ReLU+全局平均池化+全连接分类层。选择ResNet-18是为了在表达力和计算效率间取得平衡，降低在有限临床数据集上的过拟合风险。
多模态通道拼接融合: 多模态输入简单拼接在通道维度上，模型通过共享的3D卷积核学习跨模态特征。这是最基础的融合策略（early fusion），优点是简单可靠。
可解释性分析: 使用遮挡敏感性图（occlusion sensitivity maps）——同步在所有配准体积上遮挡小立方体区域，观察输出概率变化，高亮对分类最有影响的空间区域。

损失函数 / 训练策略¶

损失函数: 交叉熵损失
优化器: Adam
训练策略: 800 epochs，5折交叉验证（80患者训练集），加权随机采样器确保两类在训练中均衡表示
数据增强: 弹性变形、旋转、缩放、高斯噪声、亮度和伽马调整
评估: 以macro F1-score为主要指标（两类F1的无权平均），对类别不平衡具有鲁棒性。测试集使用交叉验证模型的多数投票集成

实验关键数据¶

输入模态	验证F1	测试F1
MRI event（单模态）	0.58	-
MRI post-OP（单模态）	0.70	-
RD map（单模态）	0.78	-
MRI post-OP + MRI event	-	-
MRI post-OP + RD	0.828	-
MRI event + RD	0.83	-
全部三模态	0.804	0.916

消融实验要点¶

放疗剂量图(RD)是信息量最大的单模态: F1=0.78，远高于术后MRI(0.70)和事件MRI(0.58)。说明空间剂量分布对组织反应有极强预测力
MRI+RD优于纯MRI: 融合剂量图后性能显著提升，验证了多模态互补价值
事件MRI单独表现最差: 反映了RICE和复发在MRI上表征的高度相似性这一临床挑战
测试集与验证集差距大: MRI-only实验中测试F1比验证F1低约0.35，凸显小样本量带来的统计不确定性
遮挡图与高剂量区域高度相关: 模型确实依赖剂量信息，同时也关注对比增强病灶区域，证实了多模态推理

亮点¶

首次系统性地将放射治疗剂量图纳入RICE vs 复发的深度学习分类，并通过消融实验量化了其关键贡献
使用临床常规T1加权MRI而非稀缺的扩散MRI，提升了临床落地可行性
遮挡敏感性分析提供了良好的可解释性，与临床直觉一致
消融设计全面（7种模态组合），清晰揭示了各模态的诊断价值

局限性 / 可改进方向¶

样本量极小: 仅92例患者（80训练+12测试），泛化能力存疑
缺乏未受影响受试者: 数据集中没有无病变的对照组
融合策略过于简单: 通道拼接的early fusion可能无法捕捉MRI与剂量图之间的复杂交互；可探索attention-based fusion、cross-modal transformer等
未纳入临床变量: 如患者年龄、肿瘤分子特征(IDH, MGMT)、治疗方案等可能有预测价值的信息
需要多中心验证: 单中心数据（海德堡大学医院）的结论能否推广到其他机构
未探索时间维度建模: 纵向数据用简单拼接处理，可考虑时序模型（如LSTM/Transformer）建模影像演变轨迹

与相关工作的对比¶

vs 扩散MRI方法: 已有研究使用扩散加权成像/动态磁敏感度加权MRI进行鉴别，但这些高级MRI序列临床可用性低。RICE-NET仅用常规T1加权MRI+剂量图即达到高F1
vs 纯影像方法: 多数现有工作不考虑剂量信息，本文通过消融实验证明剂量图是最具预测力的模态，为未来研究指明了方向

启发与关联¶

放疗剂量图作为一种非传统的"影像模态"被纳入深度学习模型，这种将治疗规划数据与诊断影像融合的思路在其他放疗相关诊断任务中也有潜力
小样本医学影像分类中模态组合消融的实验设计值得参考
可能关联idea: 20260317_hierarchical_dynamic_disease_tokens.md (跨模态复用)、20260316_2d_to_3d_medical_distill.md (3D医学影像特征学习)

评分¶

新颖性: ⭐⭐⭐ 方法本身（3D ResNet + 通道拼接）缺乏新意，但放疗剂量图纳入分类的临床视角有价值
实验充分度: ⭐⭐⭐ 消融设计全面，但样本量太小（92例），统计可靠性受限
写作质量: ⭐⭐⭐⭐ 临床动机清楚，实验分析到位，篇幅简洁
对我的价值: ⭐⭐ 临床应用导向的工作，方法创新有限，但多模态融合+可解释性的实验设计有参考价值