Transformer-Based Multi-Region Segmentation and Radiomic Analysis of HR-pQCT Imaging for Osteoporosis Classification¶

会议: CVPR2025
arXiv: 2603.09137
代码: 待确认
领域: medical_imaging
关键词: HR-pQCT, SegFormer, radiomics, osteoporosis, multi-region segmentation

一句话总结¶

首次将 SegFormer 用于 HR-pQCT 影像的多区域（骨+软组织）自动分割与放射组学分析，发现肌腱组织特征在骨质疏松分类中优于传统骨指标。

研究背景与动机¶

骨质疏松是全球最常见的骨骼疾病，临床上主要依赖 DXA（双能X线吸收法）通过骨密度 T-score 诊断（≤-2.5 即为骨质疏松），但 DXA 无法捕捉三维微结构信息和周围软织织变化。HR-pQCT（高分辨率外周定量CT）以 <60.7μm 分辨率和极低辐射（<5μSv）提供骨微结构的三维成像，但现有分析流程主要关注矿化骨区域，大量软组织信息未被利用。

现有 HR-pQCT 分割方法以传统图像处理和 CNN 为主（如 U-Net），但 CNN 难以建模长程依赖关系，且当前金标准协议仍为半自动、需手动修正。此外，骨质疏松常与肌少症共存，肌肉相关指标与骨密度显著相关，提示软组织放射组学可能具有诊断价值。这一假设是本文的核心研究动机。

方法详解¶

多区域分割¶

采用 SegFormer-B3（预训练于 Cityscapes），修改输入层以接受单通道 HR-pQCT 灰度图（将预训练 RGB 通道权重取均值初始化）。将 1600×1600 像素图像下采样至 800×800 输入，输出五类分割：胫骨皮质骨、胫骨松质骨、腓骨皮质骨、腓骨松质骨、软组织。

SegFormer 编码器生成四层次特征（200×200×64 到 25×25×512），解码器将各层投影并上采样至 200×200×768 后拼接，最终输出 200×200×6（五类+背景）。推理时用最近邻插值上采样回 1600×1600。

训练细节：Adam 优化器，学习率 1e-4，batch size 2，20 epochs，交叉熵 + Dice 联合损失。使用 ReduceLROnPlateau 调度器（验证 Dice 停滞 3 epoch 后学习率×0.1）。在 NVIDIA RTX A5500 GPU 上训练。

后处理¶

形态学约束确保每个类别仅保留最大连通区域，舞类片段按邻域多数标签重分配
皮质骨连续性通过凸包面积比较和形态学闭运算修正
软组织进一步细分：皮肤（外边界 2mm 带）、肌腱组织（100-600 HU）、脂肪组织（-600 至 -200 HU），通过种子区域生长实现

放射组学分析¶

从除皮肤外的每个解剖区域提取 939 个放射组学特征： - 7 类特征：一阶统计量（18个）、2D 形状（9个）、GLCM（24个）、GLSZM（16个）、GLRLM（16个）、NGTDM（5个）、GLDM（14个） - 8 种滤波器：LoG（σ=2）、小波、平方、平方根、对数、指数、梯度、LBP - 经方差阈值（0.02）筛选、Pearson 相关性分析（|r|>0.9 剔除）和 LASSO 回归三步降维，最终保留 3-14 个特征/区域 - 用 6 种机器学习分类器（LR、SVM、RF、XGBoost、KNN、NB）和 5 折交叉验证进行骨质疏松二分类

患者级预测¶

整合生物学指标（年龄、BMI 等 5 个）、功能评估（步速、握力等 7 个）、DXA 参数（4 个）、标准 HR-pQCT 参数（28 个）共 43 个非放射组学特征，与放射组学特征（按区域取 168 帧均值）分组构建多变量逻辑回归模型比较预测能力。

实验关键数据¶

分割性能（测试集，1,344 张图像）：

模型	软组织 IoU	胫骨皮质 IoU	胫骨松质 IoU	腓骨皮质 IoU	腓骨松质 IoU
U-Net	98.0±7.5	86.1±6.4	98.2±2.1	76.7±18.1	74.4±23.4
Attn U-Net	98.2±6.2	87.0±4.6	98.3±1.3	79.8±12.5	72.1±24.7
SegFormer	99.2±0.2	86.5±3.6	98.2±0.6	83.9±8.7	89.6±5.6

SegFormer 在腓骨松质骨 IoU 达 89.6%，比 U-Net 提升 20.43%。所有区域 IoU 标准差最低（3.74% vs U-Net 11.5%），显示更稳定的跨图像性能。平均 F1 score 达 95.36%。定性对比显示 U-Net 在腓骨松质骨处存在明显的欠分割和误分类（尤其是退化松质骨与软组织强度相似时），SegFormer 则表现更好。

特征筛选结果：最终保留的 45 个特征中，25 个为一阶统计量特征，10 个为 GLCM 纹理特征，各区域特征均值绝对相关系数在 0.358-0.526 之间。

图像级骨质疏松分类（20,496 张图像，122 例扫描）：

解剖区域	最佳分类器	Acc (%)	AUROC
胫骨皮质骨	NB	77.48	0.792
胫骨松质骨	LR	78.55	0.799
腓骨皮质骨	LR	78.99	0.847
腓骨松质骨	NB	67.86	0.709
肌腱组织	LR	80.08	0.850
脂肪组织	SVM	78.50	0.833

肌腱组织在所有区域中 AUROC 最高，超越了所有骨区域。当前SVM在脂肪织织上的表现也接近骨指标的最优值。

患者级预测：用软组织放射组学替代标准生物学+DXA+HR-pQCT参数后，AUROC 从 0.792 提升至 0.875。这一发现挑战了“骨质疏松只看骨”的传统范式，提示肌肉和脂肪组织的微观结构变化可能携带重要的诊断信息。这与肌少症、肌内脂肪浸润与骨质疏松反复共现的临床观察一致。

Hosmer-Lemeshow 检验确认逻辑回归模型标定良好，Youden 指数用于确定最优分类阈值。

亮点¶

首次 Transformer 多区域 HR-pQCT 分割：SegFormer 在少数类（腓骨）上 IoU 提升 20%+，全局上下文建模优势明显，且跨图像变异性最低
关键发现——软组织优于骨指标：肌腱组织放射组学特征 AUROC 0.850 超过所有骨区域，挑战了“骨质疏松只看骨”的传统范式，与肌少症-骨质疏松共病的临床证据一致
完整分析管线：从分割→放射组学→分类的端到端框架
图像级和患者级两个层次的评估
具备临床转化潜力
数据集将公开：6,720 张 HR-pQCT 图像 + 五类像素级标注，有劚于社区复现和拓展
特征分析深入：详细报告了三步特征筛选过程、相关性热图和特征类型分布

局限性¶

分割数据集小（40 次扫描/22 人），分类数据集也仅 122 例，统计效力有限
分割标注流程涉及手动修正和每五切片插值，标注质量存在不确定性
HR-pQCT 设备昂贵（第二代 XtremeCT II）且应用范围仅限外周骨，临床推广受限
2D 切片级分析忽略了 3D 空间信息，与 HR-pQCT 的三维成像优势矛盾
仅使用远端胫骨位点，其他常用位点（桡骨远端等）未测试
未与 3D 体积级分割方法（nnU-Net 等）对比
分类仅用 DXA T-score ≤ -2.5 定义骨质疏松，可能遗漏骨质减少患者的连续谱信息
数据来自两个中心（CUIMC 和 ICMH），多中心泛化能力仍需进一步验证
软组织分割依赖固定 HU 阈值，可能在不同扫描仪或患者群体中表现不稳定

评分¶

新颖性: 3/5 — SegFormer 用于 HR-pQCT 是首次，但方法层面主要是已有工具的组合应用
实验充分度: 4/5 — 分割+放射组学+分类+患者级全面分析，多分类器对比充分，统计检验完备
写作质量: 4/5 — 论文结构清晰，方法描述详尽，图表高质量，可复现性强
价值: 4/5 — 软组织优于骨指标的发现具有重要临床意义，数据集将公开促进后续研究