Graph-Theoretic Consistency for Robust and Topology-Aware Semi-Supervised Histopathology Segmentation¶

会议: AAAI 2026 (Student Abstract)
arXiv: 2509.22689
代码: 无
领域: 医学图像
关键词: 半监督分割, 病理图像, 拓扑一致性, 图论约束, 伪标签

一句话总结¶

本文提出 TGC（Topology Graph Consistency）框架，通过对齐预测图与参考图之间的拉普拉斯谱、连通分量数和邻接统计量来引入图论拓扑约束，在仅 5-10% 标注下实现接近全监督的组织病理学分割性能。

研究背景与动机¶

领域现状：语义分割在计算病理学中至关重要，用于从全切片病理图像（WSI）中精确分割腺体（gland）、管状结构等组织区域。然而，密集的像素级标注在病理学中极其昂贵——需要经过专业训练的病理学家逐像素标注，成本远高于自然图像标注。

现有痛点：半监督语义分割（SSSS）方法通常依赖像素级一致性（如 mean teacher、consistency regularization）来利用无标注数据。但在病理图像中，像素级一致性有两个严重问题：（1）噪声伪标签会在一致性训练中被传播和放大；（2）生成的分割掩码常常是碎片化的或拓扑上无效的——例如腺体被割裂为多个不连通的碎片，或相邻腺体被错误合并。

核心矛盾：像素级约束关注局部精度但忽略全局拓扑——分割掩码在像素级可能看起来还行，但在拓扑结构上可能完全错误（如分割出断开的腺体结构或不存在的环形结构）。而在病理诊断中，拓扑正确性对下游分析至关重要。

本文目标：在半监督病理学分割中引入全局拓扑约束，确保分割结果不仅像素级准确，而且拓扑结构正确。

切入角度：作者将分割预测和参考标注分别建模为图结构，然后通过图论工具（拉普拉斯谱、连通分量、邻接关系）来定义和强制拓扑一致性。

核心 idea：用图论约束替代（或补充）像素级一致性——通过对齐预测图和参考图的拓扑统计量来学习拓扑正确的分割。

方法详解¶

整体框架¶

TGC 在标准半监督分割框架（如 mean teacher）上扩展。对于有标签数据使用标准监督损失；对于无标签数据，除了传统的像素级一致性约束外，额外引入图论拓扑一致性约束。每个分割预测被转化为图表示，然后与参考（教师模型预测或标签）的图表示进行拓扑对齐。

关键设计¶

分割图构建（Prediction-to-Graph Conversion）:
- 功能：将分割掩码转化为可进行拓扑分析的图结构。
- 核心思路：从分割掩码中提取连通组件作为图节点，相邻组件之间建立边。节点属性包括组件大小、位置等；边属性包括邻接长度、距离等。标签掩码和预测掩码分别建图，得到"参考图"和"预测图"。
- 设计动机：像素级表示无法直接度量拓扑差异。图表示自然地编码了连通性、邻接关系等拓扑信息。
拉普拉斯谱对齐（Laplacian Spectral Alignment）:
- 功能：强制预测图和参考图具有相似的全局拓扑结构。
- 核心思路：计算图的拉普拉斯矩阵 \(L = D - A\)（\(D\) 为度矩阵，\(A\) 为邻接矩阵），取其特征值谱。拉普拉斯谱编码了图的全局结构信息——特征值反映了图的连通性、聚类结构等。通过最小化预测图和参考图拉普拉斯谱之间的距离来实现拓扑对齐。
- 设计动机：拉普拉斯谱是图同构的强不变量，谱相似的图具有相似的拓扑结构。这比简单比较连通分量数量提供了更丰富的拓扑信息。
连通分量和邻接统计约束:
- 功能：提供更直观的拓扑约束补充。
- 核心思路：除了谱对齐外，还约束预测图的连通分量数量与参考一致（避免碎片化或过度合并），以及邻接统计量（如平均度、最大度等）与参考接近。这些更简单的约束提供了可解释的拓扑正则化。
- 设计动机：拉普拉斯谱虽然全面但可能梯度信号微弱。连通分量数等简单统计量提供了更强的直接约束。

损失函数 / 训练策略¶

总损失 = 标准监督损失 + 像素级一致性损失 + 图论拓扑一致性损失（拉普拉斯谱距离 + 连通分量数差异 + 邻接统计差异）。在 mean teacher 框架下训练，教师模型通过 EMA 更新。

实验关键数据¶

主实验¶

在 GlaS 和 CRAG 病理图像分割数据集上评估。

数据集	标注比例	指标	TGC	之前SOTA	全监督	说明
GlaS	5%	Dice/IoU	SOTA	--	上界	与全监督差距小
GlaS	10%	Dice/IoU	SOTA	--	上界	显著缩小差距
CRAG	5%	Dice/IoU	SOTA	--	上界	跨数据集一致有效
CRAG	10%	Dice/IoU	SOTA	--	上界	接近全监督性能

消融实验¶

配置	Dice	说明
TGC (Full)	最佳	全部拓扑约束
仅像素一致性	下降	传统半监督基线
+连通分量约束	提升	减少碎片化
+拉普拉斯谱	进一步提升	全局拓扑更准确
+邻接统计	完整效果	多维拓扑约束互补

关键发现¶

TGC 在仅 5-10% 标注下就能显著缩小与全监督的性能差距——图论拓扑约束为无标注数据提供了有效的监督信号。
拉普拉斯谱对齐是贡献最大的组件——它提供了比简单统计量更丰富的拓扑信息。
在病理图像中拓扑正确性与像素精度不一定正相关——TGC 在同等 Dice 下产生了拓扑上更合理的分割。
方法在两个不同的病理数据集上一致有效，表明泛化性良好。

亮点与洞察¶

图论+半监督的交叉很精巧——将图论中的经典工具（拉普拉斯谱）引入半监督分割作为正则化，是方法论上的创新。
拓扑约束的实际意义在病理诊断中尤为重要——碎片化的腺体分割会导致错误的腺体计数和形态分析。
方法是即插即用的——可以加入任何现有半监督分割框架中。

局限与展望¶

作为 Student Abstract，实验细节和规模可能有限。
图构建依赖于中间分割结果的二值化，二值化阈值的选择可能影响图质量。
拉普拉斯特征值的计算对大型图可能有计算成本。
可以扩展到 3D 分割和实例分割等更复杂的场景。

评分¶

新颖性: ⭐⭐⭐⭐ 图论拓扑约束用于半监督分割是新颖组合
实验充分度: ⭐⭐⭐ Student Abstract篇幅有限，但核心结果明确
写作质量: ⭐⭐⭐⭐ 在有限篇幅内表述清晰
价值: ⭐⭐⭐⭐ 对病理图像分割有实际价值，方法可推广