跳转至

Graph-Theoretic Consistency for Robust and Topology-Aware Semi-Supervised Histopathology Segmentation

会议: AAAI 2026 (Student Abstract)
arXiv: 2509.22689
代码: 无
领域: 医学图像
关键词: 半监督分割, 病理图像, 拓扑一致性, 图论约束, 伪标签

一句话总结

本文提出 TGC(Topology Graph Consistency)框架,通过对齐预测图与参考图之间的拉普拉斯谱、连通分量数和邻接统计量来引入图论拓扑约束,在仅 5-10% 标注下实现接近全监督的组织病理学分割性能。

研究背景与动机

领域现状:语义分割在计算病理学中至关重要,用于从全切片病理图像(WSI)中精确分割腺体(gland)、管状结构等组织区域。然而,密集的像素级标注在病理学中极其昂贵——需要经过专业训练的病理学家逐像素标注,成本远高于自然图像标注。

现有痛点:半监督语义分割(SSSS)方法通常依赖像素级一致性(如 mean teacher、consistency regularization)来利用无标注数据。但在病理图像中,像素级一致性有两个严重问题:(1)噪声伪标签会在一致性训练中被传播和放大;(2)生成的分割掩码常常是碎片化的或拓扑上无效的——例如腺体被割裂为多个不连通的碎片,或相邻腺体被错误合并。

核心矛盾:像素级约束关注局部精度但忽略全局拓扑——分割掩码在像素级可能看起来还行,但在拓扑结构上可能完全错误(如分割出断开的腺体结构或不存在的环形结构)。而在病理诊断中,拓扑正确性对下游分析至关重要。

本文目标:在半监督病理学分割中引入全局拓扑约束,确保分割结果不仅像素级准确,而且拓扑结构正确。

切入角度:作者将分割预测和参考标注分别建模为图结构,然后通过图论工具(拉普拉斯谱、连通分量、邻接关系)来定义和强制拓扑一致性。

核心 idea:用图论约束替代(或补充)像素级一致性——通过对齐预测图和参考图的拓扑统计量来学习拓扑正确的分割。

方法详解

整体框架

TGC 在标准半监督分割框架(如 mean teacher)上扩展。对于有标签数据使用标准监督损失;对于无标签数据,除了传统的像素级一致性约束外,额外引入图论拓扑一致性约束。每个分割预测被转化为图表示,然后与参考(教师模型预测或标签)的图表示进行拓扑对齐。

关键设计

  1. 分割图构建(Prediction-to-Graph Conversion):

    • 功能:将分割掩码转化为可进行拓扑分析的图结构。
    • 核心思路:从分割掩码中提取连通组件作为图节点,相邻组件之间建立边。节点属性包括组件大小、位置等;边属性包括邻接长度、距离等。标签掩码和预测掩码分别建图,得到"参考图"和"预测图"。
    • 设计动机:像素级表示无法直接度量拓扑差异。图表示自然地编码了连通性、邻接关系等拓扑信息。
  2. 拉普拉斯谱对齐(Laplacian Spectral Alignment):

    • 功能:强制预测图和参考图具有相似的全局拓扑结构。
    • 核心思路:计算图的拉普拉斯矩阵 \(L = D - A\)\(D\) 为度矩阵,\(A\) 为邻接矩阵),取其特征值谱。拉普拉斯谱编码了图的全局结构信息——特征值反映了图的连通性、聚类结构等。通过最小化预测图和参考图拉普拉斯谱之间的距离来实现拓扑对齐。
    • 设计动机:拉普拉斯谱是图同构的强不变量,谱相似的图具有相似的拓扑结构。这比简单比较连通分量数量提供了更丰富的拓扑信息。
  3. 连通分量和邻接统计约束:

    • 功能:提供更直观的拓扑约束补充。
    • 核心思路:除了谱对齐外,还约束预测图的连通分量数量与参考一致(避免碎片化或过度合并),以及邻接统计量(如平均度、最大度等)与参考接近。这些更简单的约束提供了可解释的拓扑正则化。
    • 设计动机:拉普拉斯谱虽然全面但可能梯度信号微弱。连通分量数等简单统计量提供了更强的直接约束。

损失函数 / 训练策略

总损失 = 标准监督损失 + 像素级一致性损失 + 图论拓扑一致性损失(拉普拉斯谱距离 + 连通分量数差异 + 邻接统计差异)。在 mean teacher 框架下训练,教师模型通过 EMA 更新。

实验关键数据

主实验

在 GlaS 和 CRAG 病理图像分割数据集上评估。

数据集 标注比例 指标 TGC 之前SOTA 全监督 说明
GlaS 5% Dice/IoU SOTA -- 上界 与全监督差距小
GlaS 10% Dice/IoU SOTA -- 上界 显著缩小差距
CRAG 5% Dice/IoU SOTA -- 上界 跨数据集一致有效
CRAG 10% Dice/IoU SOTA -- 上界 接近全监督性能

消融实验

配置 Dice 说明
TGC (Full) 最佳 全部拓扑约束
仅像素一致性 下降 传统半监督基线
+连通分量约束 提升 减少碎片化
+拉普拉斯谱 进一步提升 全局拓扑更准确
+邻接统计 完整效果 多维拓扑约束互补

关键发现

  • TGC 在仅 5-10% 标注下就能显著缩小与全监督的性能差距——图论拓扑约束为无标注数据提供了有效的监督信号。
  • 拉普拉斯谱对齐是贡献最大的组件——它提供了比简单统计量更丰富的拓扑信息。
  • 在病理图像中拓扑正确性与像素精度不一定正相关——TGC 在同等 Dice 下产生了拓扑上更合理的分割。
  • 方法在两个不同的病理数据集上一致有效,表明泛化性良好。

亮点与洞察

  • 图论+半监督的交叉很精巧——将图论中的经典工具(拉普拉斯谱)引入半监督分割作为正则化,是方法论上的创新。
  • 拓扑约束的实际意义在病理诊断中尤为重要——碎片化的腺体分割会导致错误的腺体计数和形态分析。
  • 方法是即插即用的——可以加入任何现有半监督分割框架中。

局限与展望

  • 作为 Student Abstract,实验细节和规模可能有限。
  • 图构建依赖于中间分割结果的二值化,二值化阈值的选择可能影响图质量。
  • 拉普拉斯特征值的计算对大型图可能有计算成本。
  • 可以扩展到 3D 分割和实例分割等更复杂的场景。

相关工作与启发

  • vs Mean Teacher: Mean Teacher 仅使用像素级一致性,TGC 额外引入拓扑约束。
  • vs 拓扑损失方法(如 clDice): clDice 关注中心线的连通性,TGC 使用更全面的图论拓扑描述。
  • vs 持久同调方法: 持久同调可以检测拓扑特征但计算成本高,图论方法更轻量且梯度友好。

评分

  • 新颖性: ⭐⭐⭐⭐ 图论拓扑约束用于半监督分割是新颖组合
  • 实验充分度: ⭐⭐⭐ Student Abstract篇幅有限,但核心结果明确
  • 写作质量: ⭐⭐⭐⭐ 在有限篇幅内表述清晰
  • 价值: ⭐⭐⭐⭐ 对病理图像分割有实际价值,方法可推广

相关论文