Transformer-Based Multi-Region Segmentation and Radiomic Analysis of HR-pQCT Imaging for Osteoporosis Classification¶
会议: CVPR2025
arXiv: 2603.09137
代码: 待确认
领域: medical_imaging
关键词: HR-pQCT, SegFormer, radiomics, osteoporosis, multi-region segmentation
一句话总结¶
首次将 SegFormer 用于 HR-pQCT 影像的多区域(骨+软组织)自动分割与放射组学分析,发现肌腱组织特征在骨质疏松分类中优于传统骨指标。
研究背景与动机¶
骨质疏松是全球最常见的骨骼疾病,临床上主要依赖 DXA(双能X线吸收法)通过骨密度 T-score 诊断(≤-2.5 即为骨质疏松),但 DXA 无法捕捉三维微结构信息和周围软织织变化。HR-pQCT(高分辨率外周定量CT)以 <60.7μm 分辨率和极低辐射(<5μSv)提供骨微结构的三维成像,但现有分析流程主要关注矿化骨区域,大量软组织信息未被利用。
现有 HR-pQCT 分割方法以传统图像处理和 CNN 为主(如 U-Net),但 CNN 难以建模长程依赖关系,且当前金标准协议仍为半自动、需手动修正。此外,骨质疏松常与肌少症共存,肌肉相关指标与骨密度显著相关,提示软组织放射组学可能具有诊断价值。这一假设是本文的核心研究动机。
方法详解¶
多区域分割¶
采用 SegFormer-B3(预训练于 Cityscapes),修改输入层以接受单通道 HR-pQCT 灰度图(将预训练 RGB 通道权重取均值初始化)。将 1600×1600 像素图像下采样至 800×800 输入,输出五类分割:胫骨皮质骨、胫骨松质骨、腓骨皮质骨、腓骨松质骨、软组织。
SegFormer 编码器生成四层次特征(200×200×64 到 25×25×512),解码器将各层投影并上采样至 200×200×768 后拼接,最终输出 200×200×6(五类+背景)。推理时用最近邻插值上采样回 1600×1600。
训练细节:Adam 优化器,学习率 1e-4,batch size 2,20 epochs,交叉熵 + Dice 联合损失。使用 ReduceLROnPlateau 调度器(验证 Dice 停滞 3 epoch 后学习率×0.1)。在 NVIDIA RTX A5500 GPU 上训练。
后处理¶
- 形态学约束确保每个类别仅保留最大连通区域,舞类片段按邻域多数标签重分配
- 皮质骨连续性通过凸包面积比较和形态学闭运算修正
- 软组织进一步细分:皮肤(外边界 2mm 带)、肌腱组织(100-600 HU)、脂肪组织(-600 至 -200 HU),通过种子区域生长实现
放射组学分析¶
从除皮肤外的每个解剖区域提取 939 个放射组学特征: - 7 类特征:一阶统计量(18个)、2D 形状(9个)、GLCM(24个)、GLSZM(16个)、GLRLM(16个)、NGTDM(5个)、GLDM(14个) - 8 种滤波器:LoG(σ=2)、小波、平方、平方根、对数、指数、梯度、LBP - 经方差阈值(0.02)筛选、Pearson 相关性分析(|r|>0.9 剔除)和 LASSO 回归三步降维,最终保留 3-14 个特征/区域 - 用 6 种机器学习分类器(LR、SVM、RF、XGBoost、KNN、NB)和 5 折交叉验证进行骨质疏松二分类
患者级预测¶
整合生物学指标(年龄、BMI 等 5 个)、功能评估(步速、握力等 7 个)、DXA 参数(4 个)、标准 HR-pQCT 参数(28 个)共 43 个非放射组学特征,与放射组学特征(按区域取 168 帧均值)分组构建多变量逻辑回归模型比较预测能力。
实验关键数据¶
分割性能(测试集,1,344 张图像):
| 模型 | 软组织 IoU | 胫骨皮质 IoU | 胫骨松质 IoU | 腓骨皮质 IoU | 腓骨松质 IoU |
|---|---|---|---|---|---|
| U-Net | 98.0±7.5 | 86.1±6.4 | 98.2±2.1 | 76.7±18.1 | 74.4±23.4 |
| Attn U-Net | 98.2±6.2 | 87.0±4.6 | 98.3±1.3 | 79.8±12.5 | 72.1±24.7 |
| SegFormer | 99.2±0.2 | 86.5±3.6 | 98.2±0.6 | 83.9±8.7 | 89.6±5.6 |
SegFormer 在腓骨松质骨 IoU 达 89.6%,比 U-Net 提升 20.43%。所有区域 IoU 标准差最低(3.74% vs U-Net 11.5%),显示更稳定的跨图像性能。平均 F1 score 达 95.36%。定性对比显示 U-Net 在腓骨松质骨处存在明显的欠分割和误分类(尤其是退化松质骨与软组织强度相似时),SegFormer 则表现更好。
特征筛选结果:最终保留的 45 个特征中,25 个为一阶统计量特征,10 个为 GLCM 纹理特征,各区域特征均值绝对相关系数在 0.358-0.526 之间。
图像级骨质疏松分类(20,496 张图像,122 例扫描):
| 解剖区域 | 最佳分类器 | Acc (%) | AUROC |
|---|---|---|---|
| 胫骨皮质骨 | NB | 77.48 | 0.792 |
| 胫骨松质骨 | LR | 78.55 | 0.799 |
| 腓骨皮质骨 | LR | 78.99 | 0.847 |
| 腓骨松质骨 | NB | 67.86 | 0.709 |
| 肌腱组织 | LR | 80.08 | 0.850 |
| 脂肪组织 | SVM | 78.50 | 0.833 |
肌腱组织在所有区域中 AUROC 最高,超越了所有骨区域。当前SVM在脂肪织织上的表现也接近骨指标的最优值。
患者级预测:用软组织放射组学替代标准生物学+DXA+HR-pQCT参数后,AUROC 从 0.792 提升至 0.875。这一发现挑战了“骨质疏松只看骨”的传统范式,提示肌肉和脂肪组织的微观结构变化可能携带重要的诊断信息。这与肌少症、肌内脂肪浸润与骨质疏松反复共现的临床观察一致。
Hosmer-Lemeshow 检验确认逻辑回归模型标定良好,Youden 指数用于确定最优分类阈值。
亮点¶
- 首次 Transformer 多区域 HR-pQCT 分割:SegFormer 在少数类(腓骨)上 IoU 提升 20%+,全局上下文建模优势明显,且跨图像变异性最低
- 关键发现——软组织优于骨指标:肌腱组织放射组学特征 AUROC 0.850 超过所有骨区域,挑战了“骨质疏松只看骨”的传统范式,与肌少症-骨质疏松共病的临床证据一致
- 完整分析管线:从分割→放射组学→分类的端到端框架
- 图像级和患者级两个层次的评估
- 具备临床转化潜力
- 数据集将公开:6,720 张 HR-pQCT 图像 + 五类像素级标注,有劚于社区复现和拓展
- 特征分析深入:详细报告了三步特征筛选过程、相关性热图和特征类型分布
局限性¶
- 分割数据集小(40 次扫描/22 人),分类数据集也仅 122 例,统计效力有限
- 分割标注流程涉及手动修正和每五切片插值,标注质量存在不确定性
- HR-pQCT 设备昂贵(第二代 XtremeCT II)且应用范围仅限外周骨,临床推广受限
- 2D 切片级分析忽略了 3D 空间信息,与 HR-pQCT 的三维成像优势矛盾
- 仅使用远端胫骨位点,其他常用位点(桡骨远端等)未测试
- 未与 3D 体积级分割方法(nnU-Net 等)对比
- 分类仅用 DXA T-score ≤ -2.5 定义骨质疏松,可能遗漏骨质减少患者的连续谱信息
- 数据来自两个中心(CUIMC 和 ICMH),多中心泛化能力仍需进一步验证
- 软组织分割依赖固定 HU 阈值,可能在不同扫描仪或患者群体中表现不稳定
评分¶
- 新颖性: 3/5 — SegFormer 用于 HR-pQCT 是首次,但方法层面主要是已有工具的组合应用
- 实验充分度: 4/5 — 分割+放射组学+分类+患者级全面分析,多分类器对比充分,统计检验完备
- 写作质量: 4/5 — 论文结构清晰,方法描述详尽,图表高质量,可复现性强
- 价值: 4/5 — 软组织优于骨指标的发现具有重要临床意义,数据集将公开促进后续研究