CASL: Curvature-Augmented Self-supervised Learning for 3D Anomaly Detection¶

会议: AAAI2026
arXiv: 2511.12909
代码: GitHub
领域: 3d_vision
关键词: 3D anomaly detection, self-supervised learning, curvature, point cloud, U-Net

一句话总结¶

发现点云曲率本身就是强大的异常检测线索，提出曲率增强的自监督学习框架 CASL，通过多尺度曲率提示引导坐标重建来学习通用 3D 表征，无需任何异常检测专用机制即可在 Real3D-AD 上以 5.6% O-AUROC 优势刷新 SOTA。

基于深度学习的 3D 异常检测在工业制造质量控制中具有重要价值。现有方法大致分为两类：

这两类方法都为异常检测专门设计，泛化能力有限。相比之下，自监督点云模型（Point-MAE、PointGPT 等）遵循统一的"预训练-微调"范式追求通用表征学习，但作者实验发现这些经典模型在异常检测任务上表现不佳。

作者将原因归结为几何捷径（geometric shortcut）问题：现有自监督方法直接在坐标空间做重建，语义域和位置域完全重叠，导致学到的表征过度依赖低层空间特征，在细粒度异常检测中出现表征坍缩。

如何构建既能做好异常检测、又保持通用性的 3D 表征学习框架？

作者的关键发现：仅用每个点的曲率作为异常分数的非学习方法，已经超过了多个经典自监督模型和专用异常检测方法。这揭示了曲率在 3D 异常检测中的核心作用——异常区域边界处的曲率显著高于正常区域。曲率作为与坐标空间平行的内在几何属性，可以有效缓解几何捷径问题。

对点云中每个点 \(x_i\)，通过 k 近邻构建局部协方差矩阵并做特征值分解，定义曲率为：

\[\text{Curv}(x_i) = \frac{\lambda_1^i + \lambda_2^i + \lambda_3^i}{\lambda_1^i}\]

其中 \(\lambda_1^i \leq \lambda_2^i \leq \lambda_3^i\) 为协方差矩阵的有序特征值。该指标衡量局部表面几何变化程度。

整体基于 U-Net 架构，由三部分组成：

曲率编码器（Curvature Encoder）：MLP 嵌入层提取逐点曲率特征，后接三个编码块捕获多尺度曲率表征。每个编码块包含步长为 2 的 Minkowski 卷积下采样和 4 层残差卷积块。

坐标编码器（Coordinate Encoder）：输入为 N 个被遮蔽点的随机初始化特征，通过四个编码块逐步映射到高维特征（\(N_4 \times 256\)）。

融合解码器（Fusion Decoder）：将上一分辨率的特征通过转置卷积上采样，与当前分辨率的曲率提示拼接后经卷积块处理，逐级恢复到原始分辨率。最终输出 \(N \times 96\) 的张量，经 MLP 降维后与原始曲率特征拼接，映射回 3D 坐标空间。

与传统方法遮蔽部分坐标再从剩余坐标重建不同，CASL 遮蔽所有点坐标，完全依赖曲率提示来重建原始坐标。这迫使网络仅从曲率信息学习丰富的几何表征，从根本上避免几何捷径。

曲率在不同尺度上提供互补信息：小尺度对局部表面变化敏感（边缘、突起），大尺度捕获整体形状轮廓。

因点云规模大（通常超过 10 万点），Chamfer Distance 和 EMD 计算不可行，采用 \(\ell_1 + \ell_2\) 损失：

\[\mathcal{L}_{recon} = \mathcal{L}_1(p, p_{rec}) + \mathcal{L}_2(p, p_{rec})\]

通过在正常样本上合成伪异常（随机选取 patch 沿法线方向位移模拟凸起/凹陷），仅需在预训练骨干后添加二分类头。推理时用 softmax 输出的正常/异常概率对数比作为逐点异常分数，再通过 top-k 聚合得到样本级异常分数。

CASL 在 O-AUROC 上超出第二名 5.6%，P-AUROC 超出 4.6%。

方法	O-AUROC	P-AUROC
PO3AD	0.839	0.898
CASL	0.887	0.899

在 40 个类别的平均 O-AUROC 上超出 PO3AD 4.8%。

CASL 仅用 832 个样本预训练，在 OBJ-BG（92.08%）和 OBJ-ONLY（91.05%）上取得领先。

vs Point-MAE/PointGPT 等自监督方法：这些方法在异常检测微调时表现不佳，根因是几何捷径导致的表征坍缩；CASL 通过曲率提示解决此问题
vs PatchCore/Reg3D-AD 等特征匹配方法：虽然也使用预训练模型，但依赖为异常检测设计的特征匹配机制，不符合统一微调范式
vs IMRNet/R3D-AD 等重建方法：专为异常检测设计，泛化性弱；CASL 同一模型可迁移到分类和分割任务
vs PO3AD：同样使用伪异常策略，但 PO3AD 未解决几何捷径问题；CASL 在两个基准上均大幅超越