Deep Learning–Based Estimation of Blood Glucose Levels from Multidirectional Scleral Blood Vessel Imaging¶
会议: CVPR 2026
arXiv: 2603.12715
代码: 无
领域: 医学图像分析 / 无创检测 / 多视角融合
关键词: scleral imaging, noninvasive glucose estimation, multiview learning, transformer fusion, MRFO
一句话总结¶
提出 ScleraGluNet 框架,通过五个注视方向的巩膜血管图像,结合多分支 CNN + MRFO 特征优化 + Transformer 跨视角融合,实现 93.8% 三分类精度和 MAE=6.42 mg/dL 的空腹血糖估计。
背景与动机¶
糖尿病全球患病人数预计到 2045 年达 7.83 亿。现有血糖监测依赖血液采样(FPG/OGTT/HbA1c),频繁检测不便。巩膜浅表微血管在慢性高血糖下会发生形态、迂曲度、分支模式等重塑性改变,且比视网膜更容易用低成本设备成像。但现有方法多为单视角采集,丢失了不同巩膜区域的互补血管信息。
核心问题¶
如何利用多方向巩膜血管图像,设计一个既能进行代谢状态分类(正常/受控糖尿病/高血糖糖尿病)又能连续估计空腹血糖值的多任务深度学习框架?
方法详解¶
整体框架¶
五步流水线:标准化多方向巩膜图像采集 → 预处理与血管增强 → 多分支 CNN 特征提取 → MRFO 特征精炼 + Transformer 跨视角融合 → 分类与回归双头输出。
关键设计¶
- 多方向采集协议:采集正前方、上方、下方、鼻侧、颞侧共 5 个注视方向的巩膜照片,每人 5 张,捕获区域特异性微血管异常。标准化光照、对焦和眼位。
- 血管增强预处理:CLAHE 提升均质巩膜组织对比度 + Frangi 滤波器选择性增强管状血管结构,抑制背景噪声。通过二值化掩膜验证增强质量。
- ScleraGluNet 架构:5 个独立参数的 CNN 分支分别专化于不同巩膜区域的血管特征 → 拼接形成多视角嵌入 → MRFO(蝠鲼觅食优化)消除冗余特征 → Transformer 自注意力学习跨象限的远程血管关联 → 分类头(3 类 softmax)+ 回归头(FPG 估计)。
损失函数 / 训练策略¶
- 复合损失:Cross-Entropy(分类) + MSE(血糖回归)
- Subject-wise 5-fold 交叉验证,同一受试者所有图像严格归入同一 fold 防止数据泄漏
- Adam 优化器,超参在每个 fold 的验证集上经验调优
- Bootstrap 重采样(1000 次)计算 95% 置信区间
实验关键数据¶
- 数据集:445 人(150 正常/140 受控糖尿病/155 高血糖糖尿病),共 2225 张巩膜图像
- 分类精度:总体 93.8%(正常 94.0%、受控 92.1%、高血糖 93.5%)
- AUC:正常 0.971、受控 0.956、高血糖 0.982
- 血糖回归:MAE = 6.42 mg/dL, RMSE = 7.91 mg/dL, r = 0.983, R² = 0.966
- Bland-Altman:均值偏差 +1.45 mg/dL,95% 一致性界限 −8.33 ~ +11.23 mg/dL
- 5-fold 各 fold 精度范围 92.8%–94.6%,稳定性良好
消融实验要点¶
- 单视角 CNN → 多视角 CNN(无 MRFO/Transformer)→ +MRFO → +Transformer,MAE 逐步降低
- 多视角信息对分类和回归均有显著提升,验证了区域异质性假设
- MRFO 消除跨视角特征拼接冗余,Transformer 捕获跨象限血管模式(如非对称重塑)
亮点¶
- 首次系统利用多方向巩膜血管成像进行血糖估计,采集协议设计合理
- Grad-CAM/Grad-CAM++ 可视化证实模型关注的是血管区域而非背景,高血糖组激活更集中于扩张迂曲血管
- 回归精度在临床可接受范围内(MAE ~6.4 mg/dL),有远程医疗潜力
局限性 / 可改进方向¶
- 单中心研究(长沙爱尔眼科),需多中心验证以确认泛化性
- 未控制高血压、吸烟、贫血等混杂因素对巩膜微血管的影响
- 445 人样本量偏小,需更大规模纵向数据验证血管模式随血糖控制的动态变化
- ROI 提取为手动/半自动,限制了临床部署的自动化程度
与相关工作的对比¶
- 与视网膜 fundus 糖尿病检测:巩膜成像设备更简单、更适合大规模筛查和远程医疗,但证据基础更薄弱
- 与 PPG/热成像等无创方法:巩膜成像提供直接微血管可视化,生理耦合强于 PPG 信号
- 与 MRFO-INEYENET:ScleraGluNet 从单视角扩展到多方向,新增并行分支卷积和 Transformer 跨视角融合
启发与关联¶
- 多视角融合策略可推广到其他需要多角度采集的医学影像任务
- MRFO 在多源特征冗余场景中有参考价值
评分¶
- 新颖性: ⭐⭐⭐⭐ 巩膜多方向血管成像 + 血糖估计是新颖的临床方向
- 实验充分度: ⭐⭐⭐ 单中心、样本量有限、缺乏外部验证
- 写作质量: ⭐⭐⭐ 内容详实但部分段落冗长重复
- 价值: ⭐⭐⭐ 有趣的转化医学方向,但距临床应用仍有较大差距