FourierPET: Deep Fourier-based Unrolled Network for Low-count PET Reconstruction¶
会议: AAAI 2026
arXiv: 2601.11680
代码: 暂无
领域: 医学图像重建
关键词: PET重建, 频域分析, ADMM展开网络, 幅度-相位解耦, 低剂量成像
一句话总结¶
发现低剂量 PET 的三类退化在频域可分离——泊松噪声/光子不足导致高频相位扰动,衰减校正误差抑制低频幅度——据此提出 FourierPET:基于 ADMM 展开的频率感知重建框架,仅 0.44M 参数在三个数据集上全面 SOTA。
研究背景与动机¶
- 低剂量 PET 的三重退化:(i) 泊松噪声降低信噪比;(ii) 光子不足丢失结构细节;(iii) 衰减校正(AC)误差引入系统性强度偏差。三者在空间域交织难以分离
- 现有方法的共同缺陷:无论是迭代算法(OSEM)、端到端网络(DeepPET)还是后处理方法(RED),均在空间域以无差别方式处理退化,未利用退化的可分离性
- 核心发现(频域分析):通过幅度-相位交换实验和频率偏差剖面分析,定量验证了:
- 相位方差集中在高频 HH 子带 → 对应噪声/光子不足
- 幅度偏差主导低频 LL 子带 → 对应 AC 偏差
- 分别校正幅度和相位可带来互补性提升
方法详解¶
整体框架¶
将频率感知正则化嵌入 ADMM 优化框架,展开 K=3 次迭代形成可学习网络:
\[\min_x \underbrace{\mathcal{L}(\mathbf{A}x, y)}_{\text{数据保真}} + \lambda_a \underbrace{\mathcal{R}_{\text{amp}}(|\mathcal{F}(x)|)}_{\text{低频幅度校正}} + \lambda_p \underbrace{\mathcal{R}_{\text{phase}}(\angle\mathcal{F}(x))}_{\text{高频相位稳定}}\]
每次 ADMM 迭代包含三个模块:x-update (SCM) → z-update (APCM) → u-update (DAM)
关键设计¶
- 谱一致性模块 (SCM, x-update):
- 空间模块:3×3 和 5×5 并行深度可分离卷积提取多尺度局部特征
- 频域模块:State-Space Fourier Neural Operator (SSFNO),对 FFT 实部/虚部做 SSD 处理,跨迭代传递隐状态 \(h\)
-
通过 \(\mathbf{A}^\top\) 反投影矩阵强制测量一致性
-
幅度-相位校正模块 (APCM, z-update):
- Haar DWT 分解为 LL/HL/LH/HH 四个子带
- 幅度分支:1×1 DWConv + BN + GELU,对 LL 子带额外用 FFN 恢复被 AC 偏差抑制的低频成分
- 相位分支:\((cos\Phi, sin\Phi)\) 编码 + 高频 FFN 校正 HH 子带相位漂移 + 跨子带融合
-
修正后通过 iFFT + iDWT 重建
-
双重调整模块 (DAM, u-update):可学习标量 \(\mu\) 替代固定步长,自动适配对偶上升步长
损失函数 / 训练策略¶
\[\mathcal{L}_{total} = 0.5 \cdot \mathcal{L}_{Smooth\text{-}L1} + 0.3 \cdot \mathcal{L}_{SSIM} + 0.01 \cdot \mathcal{L}_{freq}\]
- 频域损失 \(\mathcal{L}_{freq} = |\mathcal{F}(x_{out}) - \mathcal{F}(x_{gt})|_1\)
- 优化器:AdamW,学习率 \(10^{-3} \to 10^{-5}\)(cosine annealing)
- 展开级数 K=3,内部迭代 \(\mathcal{N}=2\),训练在单张 RTX 4090 上完成
实验关键数据¶
主实验(三个数据集对比)¶
| 方法 | 参数量 | BrainWeb SSIM↑ | BrainWeb PSNR↑ | In-House SSIM↑ | In-House PSNR↑ | UDPET SSIM↑ | UDPET PSNR↑ |
|---|---|---|---|---|---|---|---|
| OSEM | - | 0.9078 | 28.35 | 0.7456 | 23.59 | 0.7607 | 19.87 |
| FBPnet | 21.35M | 0.9327 | 33.62 | 0.9592 | 34.19 | 0.8907 | 27.36 |
| RED | 28.93M | 0.9664 | 34.45 | 0.9472 | 34.15 | 0.8890 | 26.51 |
| LCPR-Net | 75.93M | 0.9769 | 33.75 | 0.9222 | 34.95 | 0.8919 | 27.77 |
| FourierPET | 0.44M | 0.9859 | 35.36 | 0.9740 | 35.19 | 0.9083 | 27.98 |
消融实验(In-House 数据集)¶
| 配置 | SSIM↑ | PSNR↑ | RMSE↓ | 说明 |
|---|---|---|---|---|
| Baseline(conv blocks) | 0.940 | 33.15 | 0.0237 | 无频域模块 |
| + SCM(替换 x-update) | 0.971 | 34.62 | 0.0200 | +1.47 PSNR |
| + APCM(替换 z-update) | 0.967 | 34.05 | 0.0210 | +0.90 PSNR |
| Full FourierPET | 0.974 | 35.19 | 0.0190 | SCM + APCM 互补 |
| SCM 子模块消融 | SSIM | PSNR | 说明 |
|---|---|---|---|
| w/o \(\mathbf{A}^\top\) | 0.8328 | 22.55 | 致命退化,测量一致性至关重要 |
| w/o SSFNO | 0.9530 | 33.69 | 全局频谱建模有价值 |
| w/o 空间模块 | 0.9681 | 34.43 | 局部特征互补 |
| Full SCM | 0.9740 | 35.19 | 三者缺一不可 |
关键发现¶
- 参数效率惊人:0.44M 参数量,比 RED (28.93M) 少 65 倍、比 LCPR-Net (75.93M) 少 172 倍,但效果全面领先
- \(\mathbf{A}^\top\) 是核心约束:去掉后 SSIM 从 0.974 暴跌至 0.833,物理一致性不可或缺
- 幅度和相位分支互补:单独用 Phase 分支提升 SSIM(结构保真),单独用 Amp 分支降低 RMSE(全局偏差),两者结合效果最优
- 零样本跨域泛化:在人体 PET 上训练的模型直接应用于小鼠 PET,仍保持高质量重建
亮点与洞察¶
- 频域退化可分离假设极具洞察力,且通过幅度-相位交换实验和 DWT 频率偏差剖面定量验证
- ADMM 展开 + 频率感知先验的结合既保持物理可解释性,又具备数据驱动的灵活性
- 0.44M 参数的极致效率对资源受限的临床部署极具价值
- 跨物种零样本泛化暗示频域退化模式具有普遍性
局限性 / 可改进方向¶
- 仅验证了脑部和全身 PET,未涉及心脏 PET 等其他模态
- K=3 展开级数是固定的,自适应深度可能进一步提升效果
- 频域分析假设退化严格可分离,实际场景中可能存在耦合
- 未与扩散模型等最新生成式重建方法对比
相关工作与启发¶
- 传统迭代方法(OSEM、MAP):物理建模准确但计算慢、先验设计困难
- 端到端方法(DeepPET、CNNBPnet):纯数据驱动,缺乏物理约束
- 展开网络(ADMM-Net、ISTA-Net):本文属于此类,但首次引入频率感知的幅度-相位解耦
- Fourier Neural Operator:本文将 SSM + FNO 融合为 SSFNO,用于全局频谱建模
评分¶
- 新颖性: ⭐⭐⭐⭐⭐ 频域退化可分离假设新颖且验证充分
- 实验充分度: ⭐⭐⭐⭐⭐ 三数据集 + 详细消融 + 跨域泛化 + 频域可视化
- 写作质量: ⭐⭐⭐⭐ 物理动机清晰,模块设计逻辑严密
- 对我的价值: ⭐⭐⭐⭐ 频域解耦思路可迁移到其他逆问题