跳转至

🏥 医学图像

📹 ICCV2025 · 共 4

An OpenMind for 3D Medical Vision Self-supervised Learning

发布了最大的公开3D医学影像预训练数据集OpenMind(114k脑MRI体积),并在该数据集上系统性benchmark了现有3D SSL方法在最先进CNN(ResEnc-L)和Transformer(Primus-M)架构上的表现,明确了3D医学图像SSL的当前SOTA。

Beyond Brain Decoding: Visual-Semantic Reconstructions to Mental Creation Extension Based on fMRI

提出NeuroCreat——一种结合LLM视觉与文本能力的脑多模态架构,将fMRI解码从单一的视觉刺激重建扩展到图像重建 + 文本描述(captioning)+ 心理创造(creation)三个层次,通过Prompt Variant Alignment模块有效弥合fMRI低分辨率信号与高级语义表征之间的鸿沟。

Boosting Vision Semantic Density with Anatomy Normality Modeling for Medical Vision-language Pre-training

提出 ViSD-Boost,通过疾病级视觉对比学习增强视觉语义 + VQ-VAE 建模解剖正常性分布来放大异常信号,解决医学 VLP 中视觉语义密度低导致的对齐偏差,在腹部 CT 54 种疾病零样本诊断达到 84.9% AUC。

CryoFastAR: Fast Cryo-EM Ab initio Reconstruction Made Easy

首个将DUSt3R式的几何基础模型范式引入冷冻电镜(cryo-EM)领域的工作,通过ViT编码器+跨视图注意力解码器直接从大量含噪粒子图像前馈预测姿态(无需迭代优化),实现了比传统方法快10-33倍的ab initio蛋白质三维重建。