DM4CT: Benchmarking Diffusion Models for Computed Tomography Reconstruction¶

会议: ICLR 2026
arXiv: 2602.18589
代码: 有
领域: 医学图像
关键词: CT重建, 扩散模型, 基准测试, 逆问题, 稀疏视图重建

一句话总结¶

提出DM4CT——首个系统性的CT重建扩散模型基准，涵盖十种扩散方法和七种基线方法，在医疗、工业和同步辐射三类数据集上进行全面评估，揭示了扩散模型在CT重建中的优势与局限。

研究背景与动机¶

CT重建是典型的逆问题，从投影测量中恢复未知物体。当测量稀疏或含噪时，问题是病态的，需要先验知识。先验方法从经典正则化（TV）发展到深度学习（监督学习、DIP），再到最近的扩散模型。

扩散模型在图像生成领域成功后被引入逆问题求解，但CT成像面临特殊挑战：相关噪声、伪影结构、系统几何依赖、值域不匹配等，使直接应用扩散模型比自然图像生成困难得多。然而缺乏统一基准来系统评估各种扩散方法。

核心贡献：不是提出新算法，而是构建首个系统性基准，回答"扩散模型在CT中到底表现如何"。

方法详解¶

整体框架¶

DM4CT从贝叶斯视角组织扩散方法：后验分布 \(p(\boldsymbol{x}|\boldsymbol{y}) \propto p(\boldsymbol{x})p(\boldsymbol{y}|\boldsymbol{x})\)，将逆向SDE修改为条件逆向SDE，关键在于如何近似测量条件项 \(\nabla_{\boldsymbol{x}_t}\log p(\boldsymbol{y}|\boldsymbol{x}_t)\)。

关键设计：统一分类体系¶

将10种扩散方法按数据一致性和先验知识策略分为五大类：

1. 数据一致性梯度引导（DC-grad）：在每步去噪后计算数据保真梯度 \(\boldsymbol{g}_t = \nabla_{\boldsymbol{x}_t}\mathcal{L}(\boldsymbol{A}\hat{\boldsymbol{x}}_0 - \boldsymbol{y})\)，用步长 \(\eta\) 控制引导强度。代表：DPS、PSLD、Reddiff等。

2. 数据一致性优化步（DC-step）：在去噪迭代间插入完整的数据一致性优化 \(\boldsymbol{x}_t^* = \arg\min \mathcal{L}(\boldsymbol{A}\boldsymbol{x}_t - \boldsymbol{y})\)。代表：ReSample、DMPlug。

3. 即插即用（Plug-and-Play）：解耦数据保真和先验，交替执行数据一致性子问题和无条件去噪步。代表：DMPlug。

4. 伪逆引导（Pseudo Inverse）：使用伪逆重建（FBP/SIRT近似）在测量空间和图像空间间传递信息。代表：MCG、PGDM。

5. 变分贝叶斯（Variational Bayes）：用参数化分布近似后验，无需沿扩散轨迹采样。代表：Reddiff、HybridReg。

数据集与配置¶

三类数据集覆盖不同应用场景：

医疗CT：2016 Low Dose CT Challenge（9卷训练+1卷测试，512×512）
工业CT：LoDoInd（管状样品含15种材料，3000+500切片）
同步辐射CT（新采集）：两块岩石样品在高能同步辐射设施扫描，768×768高分辨率

五种仿真配置系统测试鲁棒性：40角度无噪/20角度轻噪/80角度强噪/80角度噪声+环形伪影/40角度限角。

基线方法¶

七种强基线覆盖各类方法范式：

经典方法：FBP、SIRT
神经网络先验：DIP、INR
高斯散布：R2Gaussian
迭代重建：FISTA-SBTV、ADMM-PDTV
监督学习：SwinIR

实验关键数据¶

主实验¶

医疗数据集重建性能（PSNR/SSIM，部分配置）

方法	Config i (40角无噪)	Config ii (20角轻噪)	Config iv (80角噪声+环形)
FBP	26.98/0.69	9.89/0.03	14.50/0.13
SIRT	30.40/0.80	26.23/0.47	25.86/0.40
SwinIR (监督)	32.45/0.88	29.92/0.83	30.79/0.85
DDS (扩散最佳)	31.43/0.84	-	-
ReSample	32.03/0.85	27.92/0.73	29.70/0.76
INR	33.21/0.86	26.15/0.76	29.50/0.74

同步辐射真实数据（PSNR/SSIM）

方法	200投影	100投影	60投影
SwinIR	33.75/0.76	33.05/0.73	32.41/0.70
Reddiff	28.43/0.56	28.24/0.54	28.06/0.51
DDS	28.36/0.55	28.10/0.51	27.90/0.49
SIRT	28.16/0.56	28.06/0.54	27.92/0.52

消融实验¶

先验与数据一致性权衡：以DPS为例，步长 \(\eta\) 过小则先验主导（模糊），过大则测量噪声主导（崩溃）。最优 \(\eta\) 需精细调节。

像素空间 vs 潜空间扩散： - 潜空间（PSLD）：梯度需经VQ-VAE解码器传播，无噪声条件下也产生不连续伪影 - 优化步（ReSample）可修复不连续，但有噪声时过拟合测量

零空间分析：DC-grad（DPS）允许更多零空间内容，DC-step（ReSample）更严格约束，伪逆（PGDM）居中。

关键发现¶

无单一扩散方法全面最优，性能因数据集和配置而异
扩散模型整体略优于经典/MBIR方法，但通常不如全监督SwinIR
扩散模型恢复的细节虽然视觉逼真但可能偏离真值，导致指标不如INR/SwinIR的平滑重建
真实数据上性能普遍低于仿真数据，暴露训练数据质量和分布偏移问题
像素扩散通常比潜空间扩散更节省内存和时间

亮点与洞察¶

首个系统性CT扩散基准：统一代码框架（diffusers），公平对比，开源代码和数据
统一分类体系清晰梳理了方法间的设计选择和权衡
真实同步辐射数据集弥补了现有评估缺乏真实数据的空白
深刻的实践洞察：揭示了值域不匹配、有限训练数据、几何复杂性等真实部署挑战
零空间分析提供了理解不同数据一致性策略的新视角

局限性 / 可改进方向¶

仅评估2D切片重建，未涉及3D重建（螺旋/锥束几何更具挑战性）
未包含flow-based方法（如FlowDPS），这是新兴方向
临床相关性评估不足（未做分割/放射科医师评分等下游任务评价）
扩散模型训练成本高，潜空间模型总训练时间更长
自然图像预训练的自编码器未必适合CT数据
跨设备/跨协议泛化性未测试

评分¶

维度	分数
创新性	★★★★☆
理论深度	★★★☆☆
实验充分性	★★★★★
实用价值	★★★★★
写作质量	★★★★☆