SubspaceAD: Training-Free Few-Shot Anomaly Detection via Subspace Modeling¶

会议: CVPR 2026
arXiv: 2602.23013
代码: https://github.com/CLendering/SubspaceAD
领域: others / 异常检测
关键词: 少样本异常检测, PCA, DINOv2, 无训练, 子空间建模

一句话总结¶

SubspaceAD 证明了在强视觉基础模型（DINOv2-G）特征上做一次 PCA 拟合就足以超越所有需要训练/记忆库/提示调优的少样本异常检测方法，1-shot 下在 MVTec-AD 上达 98.0% 图像级 AUROC 和 97.6% 像素级 AUROC。

领域现状：工业异常检测的主流方法分三类——重建型（学习重建正常样本）、记忆库型（存储正常特征做最近邻）、VLM 型（用 CLIP 等做文本引导检测）。

现有痛点： - 重建型需要训练、调参、平衡重建质量和异常敏感度 - 记忆库型需存储数千至数百万 patch 描述子，推理时做大规模最近邻搜索 - VLM 型依赖提示调优、辅助数据集或领域特定文本先验 - 三类方法都越来越复杂（多阶段训练、数据增强、超参数调优），部署困难

核心矛盾：视觉基础模型（如 DINOv2）已经产生了足够强的特征表示，还需要这么复杂的下游管道吗？

切入角度：经典统计学原理——异常（离群值）表现为偏离正常数据主成分子空间的重建残差

核心 idea：用冻结的 DINOv2-G 提特征 + 一次 PCA 拟合正常子空间 = 免训练异常检测

SubspaceAD 只有两个阶段： 1. 拟合阶段：从 \(k\) 张正常图像（\(k \in \{1,2,4\}\)）提取多层 patch 特征，拟合 PCA 模型 2. 推理阶段：提取测试图像特征，投影到正常子空间，计算重建残差作为异常分数

多层特征聚合:
- 功能：从 DINOv2-G 的多个中间层提取 patch 特征并平均
- 核心公式：\(x_p = \frac{1}{|\mathcal{L}|}\sum_{l \in \mathcal{L}} f_l(p)\)，其中 \(\mathcal{L}\) 为第 22-28 层
- 设计动机：最深层倾向于将局部细节坍缩为类别级抽象，中间层混合了语义和结构信息。平均多层特征稳定协方差估计，减少层特定方差，确保主成分捕捉正常外观的稳定模式
PCA 子空间建模:
- 功能：用 PCA 估计正常 patch 特征的低维线性子空间
- 核心模型：\(x = \mu + Cz + \epsilon\)，其中 \(C \in \mathbb{R}^{D \times r}\) 包含 \(\Sigma\) 的前 \(r\) 个特征向量
- 保留成分数 \(r\) 由解释方差阈值 \(\tau = 0.99\) 决定：\(\sum_{i=1}^r \lambda_i \geq \tau \sum_{i=1}^D \lambda_i\)
- 数据增强：每张正常图像生成 \(N_a = 30\) 个随机旋转（0°-345°）增强视角
- 模型仅需存储 \(\mu \in \mathbb{R}^D\) 和 \(C \in \mathbb{R}^{D \times r}\)，每类不到 1MB
异常评分与定位:
- 功能：通过重建残差计算异常分数
- Patch 级评分：\(S(x_p) = \|x_p - x_\text{proj}\|_2^2\)，其中 \(x_\text{proj} = \mu + CC^\top(x_p - \mu)\)
- 图像级聚合：用尾部风险值（TVaR）取 top \(\rho = 1\%\) patch 分数的均值
- 像素级定位：双线性上采样 + 高斯平滑（\(\sigma = 4\)）
- 设计动机：重建残差直接对应正交于子空间的负对数似然，统计上有理论保证

无训练。整个方法只需一次 PCA 拟合（特征值分解），推理时间约 300ms/张（DINOv2 前向 270ms + 子空间投影 30ms）。

数据集	指标	SubspaceAD	AnomalyDINO	PromptAD	WinCLIP
MVTec-AD	Image AUROC	98.0	96.6	94.6	93.1
MVTec-AD	Pixel AUROC	97.6	96.8	95.9	95.2
MVTec-AD	PRO	93.7	92.7	87.9	87.1
VisA	Image AUROC	93.3	87.4	86.9	83.8
VisA	Pixel AUROC	98.3	97.8	96.7	96.4

4-shot 设置下 SubspaceAD 仍全面领先（MVTec 98.4% / VisA 94.5%）。

"大道至简"的典范：在所有人都在设计复杂管道的时候，证明了 PCA 这个最经典的方法在强特征上就能碾压一切。发人深省：是否很多任务的复杂度不在下游方法，而在特征表示质量？
统计学理论保证：重建残差 = 正交子空间的负对数似然，异常检测有概率论基础，不是拍脑袋设计的评分函数。
极致轻量：无训练、无记忆库、无提示调优，每类 <1MB 模型，真正可工业部署。
旋转增强的巧妙用法：不是为了"更多数据"，而是为了让协方差估计覆盖工业检测中常见的旋转变化。