跳转至

Adaptive Compressed Sensing with Diffusion-Based Posterior Sampling

会议: ECCV 2024
arXiv: 2407.08256
代码: 无公开代码
领域: 医学图像 / 压缩感知 / 扩散模型
关键词: Adaptive Compressed Sensing, Posterior Sampling, Diffusion Models, MRI, CT

一句话总结

提出AdaSense,利用预训练扩散模型的零样本后验采样来量化重建不确定性,从而自适应地选择最优测量矩阵,无需额外训练即可在人脸图像、MRI和CT等多领域实现优于非自适应方法的压缩感知重建。

背景与动机

压缩感知(CS)通过只采集少量测量就能高保真重建图像,在MRI和CT等采集耗时或有辐射的场景中意义重大。自适应CS更进一步:根据已获取的数据动态选择后续测量方向,理论上比固定策略能用更少的测量达到更好的重建。然而,现有的自适应CS方法普遍存在两大痛点:(1) 需要针对特定模态和采样策略训练复杂模型(如用强化学习训练策略网络),适配新场景成本高;(2) 很多方法只支持特定的退化类型(如仅支持像素子采样),泛化性差。

核心问题

如何设计一个免训练、跨模态通用的自适应压缩感知算法?关键难点在于:自适应选择下一步测量需要知道当前重建的不确定性分布(后验协方差),而这个分布通常难以显式获得。论文的核心问题就是:能否利用扩散模型的后验采样能力,通过生成多个样本来估计不确定性,从而指导测量选择?

方法详解

AdaSense的思路非常直观:每一轮先用扩散模型生成多个条件后验样本,用这些样本的统计信息(协方差)估计当前重建的不确定性,然后选择不确定性最大方向作为下一次测量方向。如此迭代,直到采集足够多的测量。

整体框架

输入:预训练的扩散模型、当前已有的测量 \(\mathbf{y}_{0:nr}\)。每一步: 1. 用零样本后验采样器(DDRM)从 \(p(\mathbf{x}|\mathbf{y}_{0:nr})\) 生成 \(s\) 个后验样本 2. 用样本计算经验后验协方差矩阵 \(\text{Cov}[\mathbf{x}|\mathbf{y}_{0:nr}]\) 3. 取协方差最大的 \(r\) 个特征方向(主成分)作为新的测量方向 \(\mathbf{H}_{nr:nr+r}\) 4. 用新方向做测量,得到 \(\mathbf{y}_{nr:nr+r}\),并入已有测量 5. 重复 \(N\) 步后,用所有测量做最终重建

关键设计

  1. 基于PCA的测量选择:在非约束场景下,最优的下一步测量矩阵就是后验协方差的前 \(r\) 个特征向量。这本质上是对条件分布做PCA——选择信息量最大(方差最大)的方向测量。这种选择在线性MMSE意义下是最优的。

  2. 约束测量场景的处理:在MRI中测量受限于傅里叶变换的行,CT中受限于Radon变换的行。直接优化Eq.5需要协方差矩阵满秩(要求 \(s \geq r\),当 \(r\) 很大时不现实)。论文提出次优但实用的简化:固定重建矩阵为 \(\mathbf{H}^{\dag}\),将问题简化为遍历所有可选测量矩阵并评估Eq.6的目标函数,用穷举搜索找最优。

  3. 后验采样加速:利用一致性后验采样器的性质——已选方向上方差为零,因此新选择的方向必然与之前正交。这意味着累积测量矩阵的SVD可以直接构造(\(U=I, \Sigma=I, V^T=\mathbf{H}\)),无需反复计算昂贵的SVD分解。此外,DDRM仅用25步NFE,大幅降低每次采样的计算成本。

损失函数 / 训练策略

AdaSense是完全免训练的。唯一需要的是一个预训练的扩散模型(用DDPM U-Net架构在对应领域数据上训练)。采样使用DDRM作为后验采样器,每个样本25步NFE。样本数量的经验规则是 \(s \approx \frac{4}{3} r\),即样本数略多于每步测量数即可获得足够好的协方差估计。

实验关键数据

人脸图像重建(CelebA-HQ, 256×256, 192维测量)

方法 PSNR↑ SSIM↑ LPIPS↓ Face Sim↓
Block Downsampling 20.50 0.6128 0.3035 0.6134
Bicubic Downsampling 20.86 0.6193 0.2964 0.5865
PCA (训练集) 24.60 0.7190 0.2307 0.3010
AdaSense 26.20 0.7515 0.1950 0.2674
AdaSense (Mean) 26.87 0.7713 0.2449 0.2614

MRI重建(FastMRI膝关节, 640×368)

采样策略 PSNR↑ SSIM↑
Random R10 (vertical) 24.56 0.4786
Equi-spaced R10 24.73 0.4767
AdaSense R10 27.01 0.5229
Poisson Disk R400 23.06 0.3728
AdaSense R400 25.26 0.4124

MRI主动采集对比(与训练方法比较)

方法 R8-30L PSNR R8-30L SSIM R16-2L PSNR R16-2L SSIM
Low-to-High (非自适应) 28.32 0.5948 25.66 0.4908
Reducing Uncertainty 28.66 0.6021 26.43 0.5386
SS-DDQN 28.99 0.6129 27.70 0.5691
DS-DDQN 28.98 0.6135 27.60 0.5650
Greedy Oracle (上界) 29.22 0.6264 28.23 0.5846
AdaSense (Reconstructor) 28.89 0.6108 27.51 0.5547

消融实验要点

  • 自适应程度:总测量数 \(N \cdot r\) 固定,增加迭代次数 \(N\)(更自适应)显著提升PSNR和LPIPS,验证了自适应的价值
  • 样本数量 \(s\)\(s \approx \frac{4}{3}r\) 就足够,更多样本只带来边际提升。生成样本的结果与使用真实训练数据的PCA结果接近
  • 约束 vs 非约束:非约束场景选PCA特征向量,约束场景用Eq.6遍历搜索,二者都有效

亮点

  • 完全免训练的自适应压缩感知框架,只需要一个预训练的扩散模型,无需针对退化类型做任何微调
  • 不确定性驱动的贪心测量选择策略非常直觉且理论上有solid的PCA/MMSE支撑
  • 跨域通用性强:同一个算法框架无缝适配人脸图像、MRI k-space采样、CT稀疏视角重建三种完全不同的场景
  • SVD加速技巧利用了一致采样器的正交性质,避免了反复SVD计算,使算法在实际中可行
  • 在MRI主动采集上,免训练的AdaSense与基于强化学习训练的方法(SS-DDQN等)性能接近

局限性 / 可改进方向

  • 计算成本高:每步需要生成多个后验样本,即使用快速DDRM仍然耗时。对于实时性要求高的临床场景是瓶颈
  • 依赖后验采样器质量:AdaSense的天花板被底层扩散模型的质量决定,采样器的近似误差会影响不确定性估计
  • 仅支持线性测量:无法处理非线性退化模型,限制了应用范围
  • 贪心策略非全局最优:每步独立选择最优测量,未考虑对未来步骤的影响。全局优化可能进一步提升效果
  • 可扩展方向:burst photography、best-next-view 3D重建、利用前一步样本加速后续采样

与相关工作的对比

  • vs SS-DDQN/DS-DDQN(Pineda et al., MICCAI 2020):基于强化学习的MRI主动采集方法,需要训练策略网络。AdaSense免训练但性能相当(差0.1-0.2 dB),且更灵活——换采样方案不需重新训练
  • vs Reducing Uncertainty(Zhang et al., CVPR 2019):也基于不确定性选择测量,但需要训练专门的重建网络。AdaSense用预训练扩散模型替代,思路更通用
  • vs Active Deep Probabilistic Subsampling(van Gorp et al., ICML 2021):端到端训练的自适应子采样,只支持像素级子采样。AdaSense支持任意线性测量(傅里叶、Radon等)

启发与关联

  • 与扩散模型用于医学图像重建的ideas关联:本文证明了扩散模型后验采样在MRI/CT重建场景的实用性,可为 2D→3D医学蒸馏 提供重建阶段的baseline。不确定性估计的思路也可用于主动学习——选择最不确定的样本标注
  • 自适应采样策略的泛化:不确定性驱动的贪心选择思路不局限于压缩感知,可以迁移到主动学习(选择信息量最大的样本)、实验设计(选择最优参数配置)等问题
  • 免训练 = 强泛化:这个设计哲学值得借鉴——避免端到端训练的模块,只用预训练模型的通用能力,换来跨域的灵活性

评分

  • 新颖性: ⭐⭐⭐⭐ 将零样本扩散后验采样引入自适应CS是全新视角,但核心思想(PCA选测量方向)是经典的
  • 实验充分度: ⭐⭐⭐⭐ 覆盖人脸/MRI/CT三个领域,有自适应程度和样本数量消融,但CT实验相对简略
  • 写作质量: ⭐⭐⭐⭐ 数学推导清晰,动机阐述到位,但约束测量部分的近似处理可以讲得更直观
  • 价值: ⭐⭐⭐⭐ 免训练+跨域通用是很强的卖点,对医学成像领域有实际价值,但计算成本限制了即时临床应用