跳转至

cryoSENSE: Compressive Sensing Enables High-throughput Microscopy with Sparse and Generative Priors on the Protein Cryo-EM Image Manifold

会议: CVPR 2026
arXiv: 2511.12931
代码: https://cryosense.github.io (有)
领域: 医学图像分析 / 冷冻电镜
关键词: 冷冻电镜, 压缩感知, 扩散模型, 稀疏先验, 高通量显微镜

一句话总结

提出 cryoSENSE,首个冷冻电镜压缩成像的计算框架,证明蛋白质 cryo-EM 图像在稀疏先验(DCT/小波/TV)和生成先验(扩散模型)下均可从欠采样测量中高保真重建,在保持 3D 分辨率的同时实现最高 2.5× 通量提升。

研究背景与动机

领域现状:Cryo-EM 是结构生物学的核心工具,但现代直接电子探测器每秒产生数 GB 数据,远超存储和传输带宽。当前缓解策略包括:(1) 亚帧求和、(2) 缩短采集时间后闲置传输、(3) 后置压缩——均未解决实时带宽瓶颈。

现有痛点:数据洪水限制了实际通量——设备大部分时间在等待数据传输而非在采集。亚帧求和牺牲时间分辨率,后置压缩不减轻实时带宽。

核心矛盾:Cryo-EM 原始图像数据高度结构化(蛋白质图像位于低维流形上),但现有工作流程以全分辨率采集和传输,浪费了数据中的冗余。

本文要解决:能否在采集阶段就做压缩感知,从欠采样测量中重建高保真 2D 粒子图像,进而保持 3D 重建分辨率?

切入角度:利用 cryo-EM 图像的两种低维结构——(1) 在预定义基下的稀疏性;(2) 位于可用扩散模型学习的低维流形上——设计两种互补的重建策略。

核心 idea:稀疏先验 + 生成先验 = 互补的压缩 cryo-EM 成像操作区间。

方法详解

整体框架

cryoSENSE 解决逆问题:从 \(\mathbf{y} = \mathcal{A}(\mathbf{x}^*) + \boldsymbol{\eta}\) 中恢复 \(\mathbf{x}^*\),其中 \(\mathcal{A}\) 是已知线性投影(像素域或 Fourier 域 masking)。支持像素空间和 Fourier 空间两种采样方案,以及稀疏先验和生成先验两种重建策略。

关键设计

  1. 像素域和 Fourier 域 Masking 策略

    • 像素域 masking:可通过物理编码孔径或纳米加工图案实现
    • Fourier 域 masking:可通过后焦面调制(相位板、全息光栅)实现;支持均匀下采样、环形和径向spoke 三种模式
    • 设计动机:两种域各有优势——Fourier 域 masking 与稀疏先验更匹配,像素域 masking 与生成先验更匹配。
  2. 稀疏先验重建(Proximal Gradient Descent)

    • 功能:求解凸优化问题 \(\hat{\mathbf{x}} = \arg\min_{\mathbf{x}} \|\mathcal{A}(\mathbf{x}) - \mathbf{y}\|_2^2 + \lambda \Psi(\mathbf{x})\)
    • 三种正则化:DCT 基稀疏性、小波(WT)基稀疏性、总变差(TV)
    • 交替梯度步+近端算子(软阈值)直到收敛
    • 设计动机:稀疏先验是通用的、不需要训练数据的方法,适合中等压缩率和 Fourier 域采样。
  3. 生成先验重建(DDPM 后验采样)

    • 功能:在 EMPIAR 数据上训练 DDPM 学习 cryo-EM 图像流形,通过 Tweedie 公式+修改的逆扩散引导采样: \(\nabla_{\mathbf{x}_t} \log p(\mathbf{y}|\mathbf{x}_t) \simeq -\frac{1}{\sigma^2} \nabla_{\mathbf{x}_t} \|\mathcal{A}(\hat{\mathbf{x}}_0) - \mathbf{y}\|_2^2\)
    • 使用 Nesterov 加速梯度提高采样效率
    • 设计动机:生成先验利用数据驱动的流形结构,比稀疏先验的假设更弱,在更高压缩率和像素域采样下表现更好。

损失函数 / 训练策略

  • 稀疏重建:不需要训练,纯优化
  • DDPM 训练:标准 score matching 在 EMPIAR cryo-EM 数据上训练
  • 后验采样:结合无条件 score 和测量一致性梯度

实验关键数据

主实验——2D 重建质量

像素域 Masking (K=4, C≈2):

先验 LPIPS↓ SSIM↑
Sparse-DCT 0.11 0.59
Sparse-WT 0.13 0.59
Sparse-TV 0.20 0.64
Gen-DDPM 0.12 0.50

Fourier 域 Masking (Radial spoke, C≈2.5):

先验 LPIPS↓ SSIM↑
Sparse-DCT 0.12 0.72
Sparse-WT 0.11 0.71
Sparse-TV 0.30 0.37
Gen-DDPM 0.11 0.63

3D 体积重建

压缩因子 像素域最佳先验 Fourier 域最佳先验 3D FSC 分辨率保持
1.5× Gen-DDPM Sparse-DCT 近完美
2.5× - Sparse-DCT 保持
>2.5× 退化 退化 降低

消融实验 / 关键比较

特性 稀疏先验 生成先验
最佳采样域 Fourier 域 像素域
最佳压缩范围 中等 (≤2.5×) 更高 (适合极端下采样)
是否需要训练
生物学信号保持

关键发现

  • 核心发现:稀疏先验偏好 Fourier 域采样+中等压缩,生成先验偏好像素域采样+高压缩——两者互补
  • 在 2.5× 压缩因子下 Fourier 域稀疏重建仍保持近完美 FSC 分辨率
  • CryoDRGN 构象异质性分析在重建图像上保持 80-88% 聚类一致性
  • ModelAngelo 原子模型构建在重建图像上的骨架 RMSD 仅为 2.1-2.3 Å

亮点与洞察

  • 硬件-软件协同设计:不是后置压缩,而是前置压缩感知——从数据产生源头解决带宽瓶颈
  • 互补先验框架:统一评估了两大类先验在两种采样方案下的表现,给出了明确的操作指南
  • 生物学下游验证:不仅关注 2D 重建质量,还验证了 3D 重建、构象分析、原子模型构建等核心生物学任务
  • 可实现性:Fourier 域 masking 可通过现有相位板技术实现,像素域 binning 已是探测器标配功能

局限与展望

  • 目前是计算验证而非实际硬件实验
  • DDPM 训练需要已有 cryo-EM 数据集,不适合全新类型的蛋白质
  • 极高压缩率 (>2.5×) 下所有方法都退化
  • 未探索自适应采样策略(根据图像内容动态调整 masking 模式)

相关工作与启发

  • 压缩感知在 MRI(CS-MRI)中已有成熟应用,本文将其推广到 cryo-EM
  • 4D-STEM 的压缩感知工作提供了电子显微镜领域的先例
  • DDPM 后验采样的框架(DPS、DDRM)被有效适配到 cryo-EM 场景

评分

  • 新颖性: ⭐⭐⭐⭐⭐ 首个 cryo-EM 压缩感知框架,开辟全新研究方向
  • 实验充分度: ⭐⭐⭐⭐⭐ 极其详尽——多种先验×多种采样×多种压缩率×下游生物学验证
  • 写作质量: ⭐⭐⭐⭐⭐ 理论推导清晰,实验设计系统
  • 价值: ⭐⭐⭐⭐⭐ 对 cryo-EM 高通量成像有变革性潜力

相关论文