Regularizing INR with Diffusion Prior for Self-Supervised 3D Reconstruction of Neutron Computed Tomography Data¶
会议: CVPR 2026
arXiv: 2603.10947
代码: 即将公开
领域: 3D重建 / 医学图像
关键词: 中子CT, 隐式神经表示, 扩散模型先验, 稀疏视图重建, 逆问题
一句话总结¶
将扩散模型先验作为正则化项引入隐式神经表示(INR)的损失函数中,构建DINR框架用于稀疏视图中子CT重建,在仅5个视角的极端稀疏条件下仍能保持混凝土微结构的高质量重建。
背景与动机¶
中子CT是一种通过氢分布来表征体积的重要成像方式,广泛用于燃料电池、锂电池、混凝土等材料的内部结构分析。但中子束流量低,需要更长曝光时间,这使得稀疏视图采集成为必要。传统FBP在视图数低于Nyquist采样定理要求时会产生严重伪影,MBIR需要手工设计先验(如TV、qGGMRF),而INR虽然灵活但存在频谱偏差——偏向低频分量,在稀疏监督下高频结构重建不佳。DD3IP框架已经展示了扩散先验在3D CT重建中的潜力,但其DIS(扩散逆问题求解器)部分可以替换为更好的方案。
核心问题¶
如何结合INR的连续表示能力和扩散模型的强生成先验,实现自监督的稀疏视图中子CT高质量重建?
方法详解¶
整体框架¶
DINR在DD3IP框架内将INR作为扩散逆问题求解器。与DD3IP一样,外层循环迭代扩散时间步:(1)更新扩散模型权重以适应OOD数据,(2)用DDIM采样生成估计。关键区别在于DDIM采样时的后验均值估计由INR提供,且INR的损失函数中包含扩散模型当前估计作为正则项。
关键设计¶
-
近端INR损失: INR损失包含两项——数据保真项 \(\text{MSE}(A F_\phi(S, A^*y), y)\) 和近端正则项 \(\rho \cdot \text{MSE}(\hat{x}_t, F_\phi(S, A^*y))\)。前者确保重建结果与投影数据一致,后者将INR输出拉向扩散模型去噪后的估计。\(\rho\)控制扩散先验的影响程度。
-
INR + FBP输入: INR采用SIREN架构(周期性正弦激活函数),输入不仅包括3D坐标网格\(S\),还包括FBP粗重建\(A^*y\)作为初始估计,加速收敛。
-
噪声缩放参数\(\omega\): 在初始化\(x_T\)时引入可调缩放参数\(\omega\):\(x_T = \sqrt{\alpha_T} A^*y + \sqrt{1-\alpha_T} \epsilon * \omega\),控制FBP估计相对于噪声方差的比例,调节DD3IP框架的正则化强度。
损失函数 / 训练策略¶
- INR初始化时\(\rho=0\)(纯数据保真),随后在扩散迭代中使用扩散先验正则化
- \(\rho\)选择使近端项与数据保真项比值约为\(10^{-5} \sim 10^{-6}\)
- 扩散模型仅在合成椭球体数据上预训练,推理时通过SCD权重更新适应OOD数据(混凝土微结构)
实验关键数据¶
合成数据(2×256×256体积):
| 视图数 | FBP | INR (SIREN) | DD3IP | DINR |
|---|---|---|---|---|
| 4 | 19.31/0.08 | 14.76/0.18 | 26.17/0.25 | 26.27/0.24 |
| 8 | 21.67/0.18 | 28.15/0.35 | 28.37/0.34 | 28.56/0.38 |
| 16 | 25.27/0.30 | 30.34/0.54 | 31.21/0.61 | 31.30/0.63 |
| 32 | 29.62/0.43 | 32.85/0.66 | 32.91/0.74 | 33.43/0.76 |
真实中子CT数据(混凝土微结构):
| 视图数 | FBP | MBIR(qGGMRF) | INR | DD3IP | DINR |
|---|---|---|---|---|---|
| 5 | 19.9/0.10 | 21.02/0.04 | 20.18/0.03 | 20.89/0.06 | 21.27/0.05 |
| 33 | 30.11/0.73 | 31.00/0.77 | 29.70/0.71 | 31.19/0.79 | 31.37/0.77 |
消融实验要点¶
- DINR在所有视图稀疏度下均优于DD3IP和纯INR
- 在微结构区域的ROI分析中(<32×32像素),DINR优势更加明显
- 在极端稀疏(5视图)下可与精细调参的MBIR(qGGMRF)相比甚至超越
- 当ROI包含大量背景时,MBIR因背景平滑而获得更高PSNR,但微结构区域DINR更好
亮点¶
- 将INR作为扩散框架中的DIS是自然且巧妙的组合——INR提供连续表示和物理模型集成能力,扩散先验提供高频结构的学习先验
- 近端损失公式简洁优雅,\(\rho\)一个参数控制两种先验的平衡
- 扩散模型只在简单合成数据(椭球体)上训练,却能通过SCD权重适应迁移到完全不同的混凝土微结构数据,展示了良好的OOD泛化能力
局限性 / 可改进方向¶
- 仅测试了2层的小体积(2×256×256),未验证大规模体积重建
- 缺乏系统的消融实验(作者自己承认)
- \(\rho\)和\(\omega\)参数需要手动调节
- 运行速度未报告,INR+扩散迭代可能很慢
- 定量指标(PSNR/SSIM)不能完全反映微结构重建质量,需要更好的评估方法
与相关工作的对比¶
- DD3IP: DINR是DD3IP框架的改进,仅替换DIS为INR+近端正则。在合成数据上PSNR提升0.1~0.5dB
- 纯INR (SIREN): 缺乏扩散先验,在4视图下PSNR仅14.76 vs DINR的26.27,差距巨大
- MBIR(qGGMRF): 传统方法需要exhaustive参数搜索,在超稀疏视图下DINR可匹敌或超越,且微结构区域更好
启发与关联¶
- 近端正则化将扩散先验与INR耦合的思路,可推广到NeRF等其他INR重建任务中
- OOD适应策略(合成数据训练+权重适应)对数据匮乏的科学成像领域有价值
- 微结构层面的评估需要超越PSNR/SSIM——分割精度、边界保真度等指标可能更有意义
评分¶
- 新颖性: ⭐⭐⭐ 本质上是DD3IP框架的一个增量改进——用INR替换CG作为DIS
- 实验充分度: ⭐⭐ 仅2层体积、无消融、无运行时间对比,实验较为初步
- 写作质量: ⭐⭐⭐ 方法描述清晰,但整体篇幅较短,细节不足
- 价值: ⭐⭐⭐ 对中子CT这一特定应用有价值,但通用性验证不足