跳转至

🏥 医学图像

🎞️ ECCV2024 · 共 10

Adaptive Correspondence Scoring for Unsupervised Medical Image Registration

针对医学图像无监督配准中噪声、遮挡等干扰因素导致的虚假重建误差问题,提出了一个自适应对应关系评分框架(AdaCS),通过学习像素级的对应置信度图来重新加权误差残差,以即插即用方式一致提升三种主流配准架构在三个数据集上的性能。

Alternate Diverse Teaching for Semi-supervised Medical Image Segmentation

提出 AD-MT(Alternate Diverse Mean Teacher),通过随机周期性交替更新两个教师模型 + 基于熵的冲突调和策略,在半监督医学分割中解决 confirmation bias 问题,在 ACDC/LA/Pancreas 上全面超越 SOTA。

Architecture-Agnostic Untrained Network Priors for Image Reconstruction with Frequency Regularization

提出三种与架构无关的频率正则化技术(带宽受限输入、带宽可控上采样、Lipschitz 正则化卷积层),统一解决 untrained network prior 的架构敏感性、过拟合和运行效率问题,在 MRI 重建任务中显著缩小不同架构间的性能差距。

CardiacNet: Learning to Reconstruct Abnormalities for Cardiac Disease Assessment from Echocardiogram Videos

提出基于重建的心脏疾病评估框架 CardiacNet,通过 Consistency Deformation Codebook (CDC) 和 Consistency Deformation Discriminator (CDD) 学习正常与异常心脏超声视频之间的结构和运动差异,在射血分数预测、肺动脉高压和房间隔缺损分类三个任务上达到 SOTA。

Chameleon: A Data-Efficient Generalist for Dense Visual Prediction in the Wild

提出 Chameleon,一个基于 meta-learning 和 token matching 的数据高效视觉通才模型,仅需几十张标注图像即可适应全新的密集预测任务(包括医学图像、视频、3D 等),在六个下游基准上显著超越现有通才方法。

GTP-4o: Modality-Prompted Heterogeneous Graph Learning for Omni-modal Biomedical Representation

提出 GTP-4o,一种基于模态提示的异构图学习框架,通过异构图嵌入、图提示补全缺失模态、知识引导的层级聚合,实现基因组学-病理图像-细胞图-文本等多种临床模态的统一表示学习。

Improving Medical Multi-modal Contrastive Learning with Expert Annotations

提出eCLIP,通过引入放射科医生的眼动热力图(eye-gaze heatmap)作为专家标注,利用热力图处理器和mixup增强策略扩充高质量正样本对,有效缓解医学CLIP中的"模态间隙"问题,在零样本推理、线性探测、跨模态检索和RAG报告生成等任务上取得一致性提升。

Pathology-knowledge Enhanced Multi-instance Prompt Learning for Few-shot Whole Slide Image Classification

提出 PEMP——病理知识增强的多实例提示学习框架,将视觉和文本病理先验(典型 patch/slide 示例 + 语言描述)注入 CLIP 的提示中,在 patch 和 slide 两个层级进行对比学习,显著提升少样本全切片图像(WSI)分类性能。

NePhi: Neural Deformation Fields for Approximately Diffeomorphic Medical Image Registration

NePhi用隐式神经网络(SIREN)替代传统的体素化形变场来表示配准变换,通过编码器预测latent code + 可选的测试时优化实现快速且近似微分同胚的医学图像配准,在多分辨率设置下与SOTA精度相当但内存降低5倍。

TIP: Tabular-Image Pre-training for Multimodal Classification with Incomplete Data

提出TIP框架,通过掩码表格重建、图像-表格匹配和对比学习三个自监督任务,在表格数据不完整的条件下学习鲁棒的多模态表示,在自然图像和医学图像分类任务上超越现有方法。