Graph-Theoretic Consistency for Robust and Topology-Aware Semi-Supervised Histopathology Segmentation¶
会议: AAAI 2026 (Student Abstract)
arXiv: 2509.22689
代码: 无
领域: 医学图像
关键词: 半监督分割, 病理图像, 拓扑一致性, 图论约束, 伪标签
一句话总结¶
本文提出 TGC(Topology Graph Consistency)框架,通过对齐预测图与参考图之间的拉普拉斯谱、连通分量数和邻接统计量来引入图论拓扑约束,在仅 5-10% 标注下实现接近全监督的组织病理学分割性能。
研究背景与动机¶
领域现状:语义分割在计算病理学中至关重要,用于从全切片病理图像(WSI)中精确分割腺体(gland)、管状结构等组织区域。然而,密集的像素级标注在病理学中极其昂贵——需要经过专业训练的病理学家逐像素标注,成本远高于自然图像标注。
现有痛点:半监督语义分割(SSSS)方法通常依赖像素级一致性(如 mean teacher、consistency regularization)来利用无标注数据。但在病理图像中,像素级一致性有两个严重问题:(1)噪声伪标签会在一致性训练中被传播和放大;(2)生成的分割掩码常常是碎片化的或拓扑上无效的——例如腺体被割裂为多个不连通的碎片,或相邻腺体被错误合并。
核心矛盾:像素级约束关注局部精度但忽略全局拓扑——分割掩码在像素级可能看起来还行,但在拓扑结构上可能完全错误(如分割出断开的腺体结构或不存在的环形结构)。而在病理诊断中,拓扑正确性对下游分析至关重要。
本文目标:在半监督病理学分割中引入全局拓扑约束,确保分割结果不仅像素级准确,而且拓扑结构正确。
切入角度:作者将分割预测和参考标注分别建模为图结构,然后通过图论工具(拉普拉斯谱、连通分量、邻接关系)来定义和强制拓扑一致性。
核心 idea:用图论约束替代(或补充)像素级一致性——通过对齐预测图和参考图的拓扑统计量来学习拓扑正确的分割。
方法详解¶
整体框架¶
TGC 在标准半监督分割框架(如 mean teacher)上扩展。对于有标签数据使用标准监督损失;对于无标签数据,除了传统的像素级一致性约束外,额外引入图论拓扑一致性约束。每个分割预测被转化为图表示,然后与参考(教师模型预测或标签)的图表示进行拓扑对齐。
关键设计¶
-
分割图构建(Prediction-to-Graph Conversion):
- 功能:将分割掩码转化为可进行拓扑分析的图结构。
- 核心思路:从分割掩码中提取连通组件作为图节点,相邻组件之间建立边。节点属性包括组件大小、位置等;边属性包括邻接长度、距离等。标签掩码和预测掩码分别建图,得到"参考图"和"预测图"。
- 设计动机:像素级表示无法直接度量拓扑差异。图表示自然地编码了连通性、邻接关系等拓扑信息。
-
拉普拉斯谱对齐(Laplacian Spectral Alignment):
- 功能:强制预测图和参考图具有相似的全局拓扑结构。
- 核心思路:计算图的拉普拉斯矩阵 \(L = D - A\)(\(D\) 为度矩阵,\(A\) 为邻接矩阵),取其特征值谱。拉普拉斯谱编码了图的全局结构信息——特征值反映了图的连通性、聚类结构等。通过最小化预测图和参考图拉普拉斯谱之间的距离来实现拓扑对齐。
- 设计动机:拉普拉斯谱是图同构的强不变量,谱相似的图具有相似的拓扑结构。这比简单比较连通分量数量提供了更丰富的拓扑信息。
-
连通分量和邻接统计约束:
- 功能:提供更直观的拓扑约束补充。
- 核心思路:除了谱对齐外,还约束预测图的连通分量数量与参考一致(避免碎片化或过度合并),以及邻接统计量(如平均度、最大度等)与参考接近。这些更简单的约束提供了可解释的拓扑正则化。
- 设计动机:拉普拉斯谱虽然全面但可能梯度信号微弱。连通分量数等简单统计量提供了更强的直接约束。
损失函数 / 训练策略¶
总损失 = 标准监督损失 + 像素级一致性损失 + 图论拓扑一致性损失(拉普拉斯谱距离 + 连通分量数差异 + 邻接统计差异)。在 mean teacher 框架下训练,教师模型通过 EMA 更新。
实验关键数据¶
主实验¶
在 GlaS 和 CRAG 病理图像分割数据集上评估。
| 数据集 | 标注比例 | 指标 | TGC | 之前SOTA | 全监督 | 说明 |
|---|---|---|---|---|---|---|
| GlaS | 5% | Dice/IoU | SOTA | -- | 上界 | 与全监督差距小 |
| GlaS | 10% | Dice/IoU | SOTA | -- | 上界 | 显著缩小差距 |
| CRAG | 5% | Dice/IoU | SOTA | -- | 上界 | 跨数据集一致有效 |
| CRAG | 10% | Dice/IoU | SOTA | -- | 上界 | 接近全监督性能 |
消融实验¶
| 配置 | Dice | 说明 |
|---|---|---|
| TGC (Full) | 最佳 | 全部拓扑约束 |
| 仅像素一致性 | 下降 | 传统半监督基线 |
| +连通分量约束 | 提升 | 减少碎片化 |
| +拉普拉斯谱 | 进一步提升 | 全局拓扑更准确 |
| +邻接统计 | 完整效果 | 多维拓扑约束互补 |
关键发现¶
- TGC 在仅 5-10% 标注下就能显著缩小与全监督的性能差距——图论拓扑约束为无标注数据提供了有效的监督信号。
- 拉普拉斯谱对齐是贡献最大的组件——它提供了比简单统计量更丰富的拓扑信息。
- 在病理图像中拓扑正确性与像素精度不一定正相关——TGC 在同等 Dice 下产生了拓扑上更合理的分割。
- 方法在两个不同的病理数据集上一致有效,表明泛化性良好。
亮点与洞察¶
- 图论+半监督的交叉很精巧——将图论中的经典工具(拉普拉斯谱)引入半监督分割作为正则化,是方法论上的创新。
- 拓扑约束的实际意义在病理诊断中尤为重要——碎片化的腺体分割会导致错误的腺体计数和形态分析。
- 方法是即插即用的——可以加入任何现有半监督分割框架中。
局限与展望¶
- 作为 Student Abstract,实验细节和规模可能有限。
- 图构建依赖于中间分割结果的二值化,二值化阈值的选择可能影响图质量。
- 拉普拉斯特征值的计算对大型图可能有计算成本。
- 可以扩展到 3D 分割和实例分割等更复杂的场景。
相关工作与启发¶
- vs Mean Teacher: Mean Teacher 仅使用像素级一致性,TGC 额外引入拓扑约束。
- vs 拓扑损失方法(如 clDice): clDice 关注中心线的连通性,TGC 使用更全面的图论拓扑描述。
- vs 持久同调方法: 持久同调可以检测拓扑特征但计算成本高,图论方法更轻量且梯度友好。
评分¶
- 新颖性: ⭐⭐⭐⭐ 图论拓扑约束用于半监督分割是新颖组合
- 实验充分度: ⭐⭐⭐ Student Abstract篇幅有限,但核心结果明确
- 写作质量: ⭐⭐⭐⭐ 在有限篇幅内表述清晰
- 价值: ⭐⭐⭐⭐ 对病理图像分割有实际价值,方法可推广
相关论文¶
- [NeurIPS 2025] MATCH: Multi-faceted Adaptive Topo-Consistency for Semi-Supervised Histopathology Segmentation
- [CVPR 2026] Uncertainty-Aware Concept and Motion Segmentation for Semi-Supervised Angiography Videos
- [AAAI 2026] ProPL: Universal Semi-Supervised Ultrasound Image Segmentation via Prompt-Guided Pseudo-Labeling
- [AAAI 2026] Towards Effective and Efficient Context-aware Nucleus Detection in Histopathology Whole Slide Images
- [CVPR 2026] A Semi-Supervised Framework for Breast Ultrasound Segmentation with Training-Free Pseudo-Label Generation and Label Refinement