跳转至

Regularizing INR with Diffusion Prior for Self-Supervised 3D Reconstruction of Neutron Computed Tomography Data

会议: CVPR 2026
arXiv: 2603.10947
代码: 即将公开
领域: 3D重建 / 医学图像
关键词: 中子CT, 隐式神经表示, 扩散模型先验, 稀疏视图重建, 逆问题

一句话总结

将扩散模型先验作为正则化项引入隐式神经表示(INR)的损失函数中,构建DINR框架用于稀疏视图中子CT重建,在仅5个视角的极端稀疏条件下仍能保持混凝土微结构的高质量重建。

背景与动机

中子CT是一种通过氢分布来表征体积的重要成像方式,广泛用于燃料电池、锂电池、混凝土等材料的内部结构分析。但中子束流量低,需要更长曝光时间,这使得稀疏视图采集成为必要。传统FBP在视图数低于Nyquist采样定理要求时会产生严重伪影,MBIR需要手工设计先验(如TV、qGGMRF),而INR虽然灵活但存在频谱偏差——偏向低频分量,在稀疏监督下高频结构重建不佳。DD3IP框架已经展示了扩散先验在3D CT重建中的潜力,但其DIS(扩散逆问题求解器)部分可以替换为更好的方案。

核心问题

如何结合INR的连续表示能力和扩散模型的强生成先验,实现自监督的稀疏视图中子CT高质量重建?

方法详解

整体框架

DINR在DD3IP框架内将INR作为扩散逆问题求解器。与DD3IP一样,外层循环迭代扩散时间步:(1)更新扩散模型权重以适应OOD数据,(2)用DDIM采样生成估计。关键区别在于DDIM采样时的后验均值估计由INR提供,且INR的损失函数中包含扩散模型当前估计作为正则项。

关键设计

  1. 近端INR损失: INR损失包含两项——数据保真项 \(\text{MSE}(A F_\phi(S, A^*y), y)\) 和近端正则项 \(\rho \cdot \text{MSE}(\hat{x}_t, F_\phi(S, A^*y))\)。前者确保重建结果与投影数据一致,后者将INR输出拉向扩散模型去噪后的估计。\(\rho\)控制扩散先验的影响程度。

  2. INR + FBP输入: INR采用SIREN架构(周期性正弦激活函数),输入不仅包括3D坐标网格\(S\),还包括FBP粗重建\(A^*y\)作为初始估计,加速收敛。

  3. 噪声缩放参数\(\omega\): 在初始化\(x_T\)时引入可调缩放参数\(\omega\)\(x_T = \sqrt{\alpha_T} A^*y + \sqrt{1-\alpha_T} \epsilon * \omega\),控制FBP估计相对于噪声方差的比例,调节DD3IP框架的正则化强度。

损失函数 / 训练策略

  • INR初始化时\(\rho=0\)(纯数据保真),随后在扩散迭代中使用扩散先验正则化
  • \(\rho\)选择使近端项与数据保真项比值约为\(10^{-5} \sim 10^{-6}\)
  • 扩散模型仅在合成椭球体数据上预训练,推理时通过SCD权重更新适应OOD数据(混凝土微结构)

实验关键数据

合成数据(2×256×256体积):

视图数 FBP INR (SIREN) DD3IP DINR
4 19.31/0.08 14.76/0.18 26.17/0.25 26.27/0.24
8 21.67/0.18 28.15/0.35 28.37/0.34 28.56/0.38
16 25.27/0.30 30.34/0.54 31.21/0.61 31.30/0.63
32 29.62/0.43 32.85/0.66 32.91/0.74 33.43/0.76

真实中子CT数据(混凝土微结构):

视图数 FBP MBIR(qGGMRF) INR DD3IP DINR
5 19.9/0.10 21.02/0.04 20.18/0.03 20.89/0.06 21.27/0.05
33 30.11/0.73 31.00/0.77 29.70/0.71 31.19/0.79 31.37/0.77

消融实验要点

  • DINR在所有视图稀疏度下均优于DD3IP和纯INR
  • 在微结构区域的ROI分析中(<32×32像素),DINR优势更加明显
  • 在极端稀疏(5视图)下可与精细调参的MBIR(qGGMRF)相比甚至超越
  • 当ROI包含大量背景时,MBIR因背景平滑而获得更高PSNR,但微结构区域DINR更好

亮点

  • 将INR作为扩散框架中的DIS是自然且巧妙的组合——INR提供连续表示和物理模型集成能力,扩散先验提供高频结构的学习先验
  • 近端损失公式简洁优雅,\(\rho\)一个参数控制两种先验的平衡
  • 扩散模型只在简单合成数据(椭球体)上训练,却能通过SCD权重适应迁移到完全不同的混凝土微结构数据,展示了良好的OOD泛化能力

局限性 / 可改进方向

  • 仅测试了2层的小体积(2×256×256),未验证大规模体积重建
  • 缺乏系统的消融实验(作者自己承认)
  • \(\rho\)\(\omega\)参数需要手动调节
  • 运行速度未报告,INR+扩散迭代可能很慢
  • 定量指标(PSNR/SSIM)不能完全反映微结构重建质量,需要更好的评估方法

与相关工作的对比

  • DD3IP: DINR是DD3IP框架的改进,仅替换DIS为INR+近端正则。在合成数据上PSNR提升0.1~0.5dB
  • 纯INR (SIREN): 缺乏扩散先验,在4视图下PSNR仅14.76 vs DINR的26.27,差距巨大
  • MBIR(qGGMRF): 传统方法需要exhaustive参数搜索,在超稀疏视图下DINR可匹敌或超越,且微结构区域更好

启发与关联

  • 近端正则化将扩散先验与INR耦合的思路,可推广到NeRF等其他INR重建任务中
  • OOD适应策略(合成数据训练+权重适应)对数据匮乏的科学成像领域有价值
  • 微结构层面的评估需要超越PSNR/SSIM——分割精度、边界保真度等指标可能更有意义

评分

  • 新颖性: ⭐⭐⭐ 本质上是DD3IP框架的一个增量改进——用INR替换CG作为DIS
  • 实验充分度: ⭐⭐ 仅2层体积、无消融、无运行时间对比,实验较为初步
  • 写作质量: ⭐⭐⭐ 方法描述清晰,但整体篇幅较短,细节不足
  • 价值: ⭐⭐⭐ 对中子CT这一特定应用有价值,但通用性验证不足