Synergistic Bleeding Region and Point Detection in Laparoscopic Surgical Videos¶

会议: CVPR 2026 arXiv: 2503.22174 代码: GitHub 领域: 医学图像 关键词: 出血检测, 腹腔镜手术, SAM2, 双任务协同, 光流

一句话总结¶

构建首个腹腔镜手术出血区域+出血点标注数据集 SurgBlood，并提出基于 SAM2 的双分支双向引导在线检测器 BlooDet，通过 Mask/Point 分支协同优化实现出血区域分割与出血点定位的联合检测。

研究背景与动机¶

腹腔镜微创手术中，术中出血是严重影响手术安全的紧急情况： - 出血区域检测可量化失血量，辅助术中决策 - 出血点定位帮助外科医生快速找到出血源实施止血

现有方法的局限： 1. 大多数算法只针对单帧图像，缺乏视频时序建模 2. 主要关注出血区域，未解决出血源定位的临床需求 3. 多任务框架未充分利用 SAM2 在跨任务联合优化中的潜力 4. 缺乏公开的多任务真实出血数据集

挑战：腹腔镜窄视野、不稳定光照、快速血液积聚改变组织外观、出血点被血液或组织遮盖。

方法详解¶

整体框架¶

BlooDet 采用基于 SAM2 的双分支双向引导架构，包含 Mask 分支（出血区域检测）和 Point 分支（出血点定位）。两分支通过互相提供 prompt 和时序信息实现协同优化。核心目标函数为耦合优化：

\[\{\boldsymbol{\theta}^*, \boldsymbol{\vartheta}^*\} = \arg\min_{\boldsymbol{\theta}, \boldsymbol{\vartheta}} \Big[\mathcal{L}_{\mathtt{m}}\big(\boldsymbol{\theta}(\boldsymbol{\vartheta})\big) + \mathcal{L}_{\mathtt{p}}\big(\boldsymbol{\vartheta}(\boldsymbol{\theta})\big)\Big]\]

通过交替优化策略求解：先固定 Point 分支更新 Mask 分支参数，再固定更新后的 Mask 分支更新 Point 分支。

关键设计¶

Point 分支 — 光流引导的出血点记忆建模：使用冻结的 PWC-Net 估计帧间光流 $O_i(x,y)$，结合反转的 Mask 地图过滤出血区域不稳定光流，计算平均视点偏移： $$\bar{O}_i(\Delta x, \Delta y) = \frac{1}{H \times W} \sum_{X=1}^{H} \sum_{Y=1}^{W} (1-M_i) \cdot O_i(x,y)$$ 然后将前帧 Mask 记忆特征与 Point 特征融合，通过自注意力和交叉注意力生成记忆增强的 Point 特征。核心思想：利用背景区域的光流补偿相机运动，同时利用 Mask 记忆缩小出血点搜索空间。
Mask 分支 — 边缘生成器与自适应 Prompt 嵌入：采用多尺度 Gabor 小波拉普拉斯滤波器增强出血边缘： $$F'_{\text{mask}} = (\text{ReLU}(F_{\text{mask}})) \odot (\mathbf{L}_\mathbf{g}(x,y) * F_{\text{mask}})$$ 将边缘图 $E_m$ 与 Point 分支生成的出血点图 $P_m$ 组合为自适应 prompt 输入 Mask 解码器，替代人工交互式 prompt。
双向跨分支引导：Point 分支的预测出血点作为 Mask 解码器的自动 prompt 聚焦目标区域；Mask 分支的预测 Mask 为 Point 分支提供时序方向线索和空间约束。两分支互相约束、互相增强。

损失函数 / 训练策略¶

Mask 分支：$\mathcal{L}_\mathtt{m} = \lambda_\mathtt{r} \mathcal{L}_\mathtt{r} + \lambda_\mathtt{e} \mathcal{L}_\mathtt{e}$，区域损失和边缘损失均为 Focal Loss + Dice Loss
Point 分支：$\mathcal{L}_\mathtt{p} = \lambda_\mathcal{P} \mathcal{L}_\mathcal{P} + \lambda_\mathtt{s} \mathcal{L}_\mathtt{s}$，使用 Smooth L1 Loss 做点监督 + BCE 做存在性判断
损失权重：$\lambda_\mathtt{r}=1, \lambda_\mathtt{e}=1, \lambda_\mathtt{s}=1, \lambda_\mathcal{P}=0.5$
交替优化策略：每次迭代先更新 Mask 分支再更新 Point 分支

SurgBlood 数据集：42 例胆囊切除术中 95 个视频片段，共 5,330 帧，分辨率 1280×720，由肝胆外科医生标注出血区域像素级 mask 和出血点坐标。4 种出血类型：胆囊(21.64%)、胆囊三角(25.01%)、血管(15.78%)、胆囊床(37.75%)。

实验关键数据¶

主实验¶

方法	SurgBlood IoU ↑	SurgBlood Dice ↑	PCK-5% ↑	PCK-10% ↑
SAM 2†	50.93	67.49	41.68	71.99
MemSAM†	52.84	69.14	31.80	64.91
D-CeLR*	51.30	67.82	24.22	63.92
ConsisTNet	40.43	57.59	32.83	68.15
BlooDet (Ours)	64.88	78.70	55.85	83.69

BlooDet 在 SurgBlood 上超越 13 个对比方法，IoU 提升 12.05%（vs SAM2），PCK-10% 提升 11.70%。在 HemoSet 数据集上也取得最佳区域检测性能（IoU 59.62, Dice 74.70）。

消融实验¶

配置	SurgBlood DSC ↑	CAVSA 注	说明
仅 Mask + Point（无边缘生成器，无时序一致性）	~67.49	—	基础 SAM2 双任务
+ 边缘生成器 + 跨分支引导	78.70	—	完整 BlooDet

（注：论文在 XCAV/CAVSA 数据集上也做了消融，完整模型 DSC 84.39%，去掉时序一致性降至 76.24%，去掉置信度正则化降至 76.71%。）

关键发现¶

纯区域检测方法加额外点预测头后性能较差，说明需专门的协同设计
光流+Mask 记忆对出血点追踪至关重要，解决了相机运动导致的偏移
边缘生成器有效缓解手术场景低对比度下的出血边界模糊问题
交替优化策略使两分支达到联合最优

亮点与洞察¶

首创任务：首次提出腹腔镜手术出血区域+出血点联合检测任务
SurgBlood 数据集：首个提供出血区域和出血点双标注的真实手术视频数据集
双分支双向引导设计优雅——Mask 为 Point 提供空间约束，Point 为 Mask 提供精确 prompt
巧妙利用背景光流（排除出血区域）补偿相机运动偏移

局限性 / 可改进方向¶

数据集规模偏小（95 个片段），泛化性有待验证
仅在胆囊切除术上验证，需扩展到更多手术类型
Point 分支依赖冻结的 PWC-Net 光流，在极端出血模糊场景性能可能退化
未考虑多出血点场景和出血强度量化

评分¶

新颖性: ⭐⭐⭐⭐⭐ — 首创任务定义 + 首个数据集 + 新颖双分支架构
实验充分度: ⭐⭐⭐⭐ — 13 个对比方法 + 多数据集验证 + 完整消融
写作质量: ⭐⭐⭐⭐ — 结构清晰，方法表述完整
价值: ⭐⭐⭐⭐⭐ — 有很强的临床实用价值和数据集贡献