跳转至

Deep Learning–Based Estimation of Blood Glucose Levels from Multidirectional Scleral Blood Vessel Imaging

会议: CVPR 2026
arXiv: 2603.12715
代码: 无
领域: 医学图像分析 / 无创检测 / 多视角融合
关键词: scleral imaging, noninvasive glucose estimation, multiview learning, transformer fusion, MRFO

一句话总结

提出 ScleraGluNet 框架,通过五个注视方向的巩膜血管图像,结合多分支 CNN + MRFO 特征优化 + Transformer 跨视角融合,实现 93.8% 三分类精度和 MAE=6.42 mg/dL 的空腹血糖估计。

背景与动机

糖尿病全球患病人数预计到 2045 年达 7.83 亿。现有血糖监测依赖血液采样(FPG/OGTT/HbA1c),频繁检测不便。巩膜浅表微血管在慢性高血糖下会发生形态、迂曲度、分支模式等重塑性改变,且比视网膜更容易用低成本设备成像。但现有方法多为单视角采集,丢失了不同巩膜区域的互补血管信息。

核心问题

如何利用多方向巩膜血管图像,设计一个既能进行代谢状态分类(正常/受控糖尿病/高血糖糖尿病)又能连续估计空腹血糖值的多任务深度学习框架?

方法详解

整体框架

五步流水线:标准化多方向巩膜图像采集 → 预处理与血管增强 → 多分支 CNN 特征提取 → MRFO 特征精炼 + Transformer 跨视角融合 → 分类与回归双头输出。

关键设计

  1. 多方向采集协议:采集正前方、上方、下方、鼻侧、颞侧共 5 个注视方向的巩膜照片,每人 5 张,捕获区域特异性微血管异常。标准化光照、对焦和眼位。
  2. 血管增强预处理:CLAHE 提升均质巩膜组织对比度 + Frangi 滤波器选择性增强管状血管结构,抑制背景噪声。通过二值化掩膜验证增强质量。
  3. ScleraGluNet 架构:5 个独立参数的 CNN 分支分别专化于不同巩膜区域的血管特征 → 拼接形成多视角嵌入 → MRFO(蝠鲼觅食优化)消除冗余特征 → Transformer 自注意力学习跨象限的远程血管关联 → 分类头(3 类 softmax)+ 回归头(FPG 估计)。

损失函数 / 训练策略

  • 复合损失:Cross-Entropy(分类) + MSE(血糖回归)
  • Subject-wise 5-fold 交叉验证,同一受试者所有图像严格归入同一 fold 防止数据泄漏
  • Adam 优化器,超参在每个 fold 的验证集上经验调优
  • Bootstrap 重采样(1000 次)计算 95% 置信区间

实验关键数据

  • 数据集:445 人(150 正常/140 受控糖尿病/155 高血糖糖尿病),共 2225 张巩膜图像
  • 分类精度:总体 93.8%(正常 94.0%、受控 92.1%、高血糖 93.5%)
  • AUC:正常 0.971、受控 0.956、高血糖 0.982
  • 血糖回归:MAE = 6.42 mg/dL, RMSE = 7.91 mg/dL, r = 0.983, R² = 0.966
  • Bland-Altman:均值偏差 +1.45 mg/dL,95% 一致性界限 −8.33 ~ +11.23 mg/dL
  • 5-fold 各 fold 精度范围 92.8%–94.6%,稳定性良好

消融实验要点

  • 单视角 CNN → 多视角 CNN(无 MRFO/Transformer)→ +MRFO → +Transformer,MAE 逐步降低
  • 多视角信息对分类和回归均有显著提升,验证了区域异质性假设
  • MRFO 消除跨视角特征拼接冗余,Transformer 捕获跨象限血管模式(如非对称重塑)

亮点

  • 首次系统利用多方向巩膜血管成像进行血糖估计,采集协议设计合理
  • Grad-CAM/Grad-CAM++ 可视化证实模型关注的是血管区域而非背景,高血糖组激活更集中于扩张迂曲血管
  • 回归精度在临床可接受范围内(MAE ~6.4 mg/dL),有远程医疗潜力

局限性 / 可改进方向

  • 单中心研究(长沙爱尔眼科),需多中心验证以确认泛化性
  • 未控制高血压、吸烟、贫血等混杂因素对巩膜微血管的影响
  • 445 人样本量偏小,需更大规模纵向数据验证血管模式随血糖控制的动态变化
  • ROI 提取为手动/半自动,限制了临床部署的自动化程度

与相关工作的对比

  • 与视网膜 fundus 糖尿病检测:巩膜成像设备更简单、更适合大规模筛查和远程医疗,但证据基础更薄弱
  • 与 PPG/热成像等无创方法:巩膜成像提供直接微血管可视化,生理耦合强于 PPG 信号
  • 与 MRFO-INEYENET:ScleraGluNet 从单视角扩展到多方向,新增并行分支卷积和 Transformer 跨视角融合

启发与关联

  • 多视角融合策略可推广到其他需要多角度采集的医学影像任务
  • MRFO 在多源特征冗余场景中有参考价值

评分

  • 新颖性: ⭐⭐⭐⭐ 巩膜多方向血管成像 + 血糖估计是新颖的临床方向
  • 实验充分度: ⭐⭐⭐ 单中心、样本量有限、缺乏外部验证
  • 写作质量: ⭐⭐⭐ 内容详实但部分段落冗长重复
  • 价值: ⭐⭐⭐ 有趣的转化医学方向,但距临床应用仍有较大差距