跳转至

FourierPET: Deep Fourier-based Unrolled Network for Low-count PET Reconstruction

会议: AAAI 2026
arXiv: 2601.11680
代码: 暂无
领域: 医学图像重建
关键词: PET重建, 频域分析, ADMM展开网络, 幅度-相位解耦, 低剂量成像

一句话总结

发现低剂量 PET 的三类退化在频域可分离——泊松噪声/光子不足导致高频相位扰动,衰减校正误差抑制低频幅度——据此提出 FourierPET:基于 ADMM 展开的频率感知重建框架,仅 0.44M 参数在三个数据集上全面 SOTA。

研究背景与动机

  1. 低剂量 PET 的三重退化:(i) 泊松噪声降低信噪比;(ii) 光子不足丢失结构细节;(iii) 衰减校正(AC)误差引入系统性强度偏差。三者在空间域交织难以分离
  2. 现有方法的共同缺陷:无论是迭代算法(OSEM)、端到端网络(DeepPET)还是后处理方法(RED),均在空间域以无差别方式处理退化,未利用退化的可分离性
  3. 核心发现(频域分析):通过幅度-相位交换实验和频率偏差剖面分析,定量验证了:
  4. 相位方差集中在高频 HH 子带 → 对应噪声/光子不足
  5. 幅度偏差主导低频 LL 子带 → 对应 AC 偏差
  6. 分别校正幅度和相位可带来互补性提升

方法详解

整体框架

将频率感知正则化嵌入 ADMM 优化框架,展开 K=3 次迭代形成可学习网络:

\[\min_x \underbrace{\mathcal{L}(\mathbf{A}x, y)}_{\text{数据保真}} + \lambda_a \underbrace{\mathcal{R}_{\text{amp}}(|\mathcal{F}(x)|)}_{\text{低频幅度校正}} + \lambda_p \underbrace{\mathcal{R}_{\text{phase}}(\angle\mathcal{F}(x))}_{\text{高频相位稳定}}\]

每次 ADMM 迭代包含三个模块:x-update (SCM) → z-update (APCM) → u-update (DAM)

关键设计

  1. 谱一致性模块 (SCM, x-update)
  2. 空间模块:3×3 和 5×5 并行深度可分离卷积提取多尺度局部特征
  3. 频域模块:State-Space Fourier Neural Operator (SSFNO),对 FFT 实部/虚部做 SSD 处理,跨迭代传递隐状态 \(h\)
  4. 通过 \(\mathbf{A}^\top\) 反投影矩阵强制测量一致性

  5. 幅度-相位校正模块 (APCM, z-update)

  6. Haar DWT 分解为 LL/HL/LH/HH 四个子带
  7. 幅度分支:1×1 DWConv + BN + GELU,对 LL 子带额外用 FFN 恢复被 AC 偏差抑制的低频成分
  8. 相位分支:\((cos\Phi, sin\Phi)\) 编码 + 高频 FFN 校正 HH 子带相位漂移 + 跨子带融合
  9. 修正后通过 iFFT + iDWT 重建

  10. 双重调整模块 (DAM, u-update):可学习标量 \(\mu\) 替代固定步长,自动适配对偶上升步长

损失函数 / 训练策略

\[\mathcal{L}_{total} = 0.5 \cdot \mathcal{L}_{Smooth\text{-}L1} + 0.3 \cdot \mathcal{L}_{SSIM} + 0.01 \cdot \mathcal{L}_{freq}\]
  • 频域损失 \(\mathcal{L}_{freq} = |\mathcal{F}(x_{out}) - \mathcal{F}(x_{gt})|_1\)
  • 优化器:AdamW,学习率 \(10^{-3} \to 10^{-5}\)(cosine annealing)
  • 展开级数 K=3,内部迭代 \(\mathcal{N}=2\),训练在单张 RTX 4090 上完成

实验关键数据

主实验(三个数据集对比)

方法 参数量 BrainWeb SSIM↑ BrainWeb PSNR↑ In-House SSIM↑ In-House PSNR↑ UDPET SSIM↑ UDPET PSNR↑
OSEM - 0.9078 28.35 0.7456 23.59 0.7607 19.87
FBPnet 21.35M 0.9327 33.62 0.9592 34.19 0.8907 27.36
RED 28.93M 0.9664 34.45 0.9472 34.15 0.8890 26.51
LCPR-Net 75.93M 0.9769 33.75 0.9222 34.95 0.8919 27.77
FourierPET 0.44M 0.9859 35.36 0.9740 35.19 0.9083 27.98

消融实验(In-House 数据集)

配置 SSIM↑ PSNR↑ RMSE↓ 说明
Baseline(conv blocks) 0.940 33.15 0.0237 无频域模块
+ SCM(替换 x-update) 0.971 34.62 0.0200 +1.47 PSNR
+ APCM(替换 z-update) 0.967 34.05 0.0210 +0.90 PSNR
Full FourierPET 0.974 35.19 0.0190 SCM + APCM 互补
SCM 子模块消融 SSIM PSNR 说明
w/o \(\mathbf{A}^\top\) 0.8328 22.55 致命退化,测量一致性至关重要
w/o SSFNO 0.9530 33.69 全局频谱建模有价值
w/o 空间模块 0.9681 34.43 局部特征互补
Full SCM 0.9740 35.19 三者缺一不可

关键发现

  • 参数效率惊人:0.44M 参数量,比 RED (28.93M) 少 65 倍、比 LCPR-Net (75.93M) 少 172 倍,但效果全面领先
  • \(\mathbf{A}^\top\) 是核心约束:去掉后 SSIM 从 0.974 暴跌至 0.833,物理一致性不可或缺
  • 幅度和相位分支互补:单独用 Phase 分支提升 SSIM(结构保真),单独用 Amp 分支降低 RMSE(全局偏差),两者结合效果最优
  • 零样本跨域泛化:在人体 PET 上训练的模型直接应用于小鼠 PET,仍保持高质量重建

亮点与洞察

  1. 频域退化可分离假设极具洞察力,且通过幅度-相位交换实验和 DWT 频率偏差剖面定量验证
  2. ADMM 展开 + 频率感知先验的结合既保持物理可解释性,又具备数据驱动的灵活性
  3. 0.44M 参数的极致效率对资源受限的临床部署极具价值
  4. 跨物种零样本泛化暗示频域退化模式具有普遍性

局限性 / 可改进方向

  • 仅验证了脑部和全身 PET,未涉及心脏 PET 等其他模态
  • K=3 展开级数是固定的,自适应深度可能进一步提升效果
  • 频域分析假设退化严格可分离,实际场景中可能存在耦合
  • 未与扩散模型等最新生成式重建方法对比

相关工作与启发

  • 传统迭代方法(OSEM、MAP):物理建模准确但计算慢、先验设计困难
  • 端到端方法(DeepPET、CNNBPnet):纯数据驱动,缺乏物理约束
  • 展开网络(ADMM-Net、ISTA-Net):本文属于此类,但首次引入频率感知的幅度-相位解耦
  • Fourier Neural Operator:本文将 SSM + FNO 融合为 SSFNO,用于全局频谱建模

评分

  • 新颖性: ⭐⭐⭐⭐⭐ 频域退化可分离假设新颖且验证充分
  • 实验充分度: ⭐⭐⭐⭐⭐ 三数据集 + 详细消融 + 跨域泛化 + 频域可视化
  • 写作质量: ⭐⭐⭐⭐ 物理动机清晰,模块设计逻辑严密
  • 对我的价值: ⭐⭐⭐⭐ 频域解耦思路可迁移到其他逆问题