DECOR: Deep Embedding Clustering with Orientation Robustness¶

会议: AAAI 2026 (KGML Bridge, non-archival)
arXiv: 2510.03328
代码: 无
领域: 其他
关键词: 深度聚类, 旋转不变性, 晶圆缺陷检测, 非参数聚类, 异常检测

一句话总结¶

提出 DECOR 框架，通过旋转不变的等变卷积自编码器（RCAE）+ 非参数聚类（DeepDPM）+ 集成异常检测，实现晶圆图缺陷模式的方向鲁棒聚类。

研究背景与动机¶

半导体制造中，晶圆缺陷的早期检测对产品良率至关重要。然而晶圆质量测试的原始数据面临多个挑战：

数据复杂且无标签：晶圆图模式复杂，且通常缺乏人工标注

类别不平衡：不同缺陷类型的频率差异巨大

多缺陷叠加：单个晶圆可能同时包含多种缺陷模式

方向变异性：由于晶圆放置或处理过程中的变化，相同的缺陷模式可能以不同旋转角度出现。标准聚类方法把旋转的实例视为不同模式，导致聚类碎片化

传统聚类方法（K-Means、DBSCAN 等）依赖固定假设（如聚类数 k、距离阈值 ε），在晶圆缺陷分布随时间演变的动态环境中不够实用。这促使作者采用非参数方法自适应发现聚类，同时通过等变网络处理方向变异性。

核心动机：设计一种无需预设聚类数量、对旋转鲁棒的深度聚类框架，使得空间上相似的缺陷无论旋转角度如何都能被一致地聚类。

方法详解¶

整体框架¶

DECOR 是一个三阶段的框架：(A) 旋转和翻转不变的嵌入提取器 RCAE，(B) 非参数聚类模块 DeepDPM，(C) 集成异常检测机制。

输入晶圆图 → 归一化与掩码 → RCAE 特征提取（128维） → DeepDPM 聚类 → 集成异常检测

关键设计¶

旋转不变卷积自编码器（RCAE）：

使用 e2cnn 库中的 R2Conv 层构建等变编码器。编码器包含三个等变块，每个块由 R2Conv + ReLU + PointwiseAvgPool（stride=2）组成，通道数递增为 8→16→32。关键设计是实现对二面体群 $D_4$ 的等变性——包括4个离散旋转（0°, 90°, 180°, 270°）和2个镜像翻转。

通过 GroupPooling 将等变特征转换为方向不变描述子（collapse 所有方向通道），然后使用线性层映射到 128 维隐向量。解码器镜像编码器结构，使用 ConvTranspose2D 重建图像。

设计动机：相比 MoCo 等对比学习方法，RCAE 内建了对称性处理，产生更紧凑且可分离的聚类。实验验证了 RCAE 在降维空间中形成更好分离的聚类。

非参数聚类（DeepDPM）：

基于 Dirichlet 过程混合模型（DPMM）的深度聚类框架，不需要预设聚类数量。与 K-Means 不同，DeepDPM 从数据分布中推断最优聚类数。

实现为两层 MLP：Linear(128, 50) → Linear(50, K)，其中 K 在训练过程中自适应确定。模型产生软聚类成员概率，通过 argmax 获得硬标签。

超参数设置：$\nu = d + 2$（d 为输入维度），$k_{init} = 30$，最大训练 epoch = 200。

集成异常检测：

组合 Isolation Forest（IF）和 Local Outlier Factor（LOF）两种检测器，只有两者同时判定为异常时才标记为异常（$\mathbf{1}_{final} = \mathbf{1}_{IF} \wedge \mathbf{1}_{LOF}$）。

关键创新在于鲁棒的自适应阈值： $$\tau = \text{median}(s) + k \cdot \text{MAD}(s)$$ 使用中位数和 MAD 而非均值和标准差，确保对重尾分布和已存在异常点的鲁棒性。

LOF 的邻居数自适应选择：$k_{LOF} = \text{clip}(\sqrt{N}, k_{min}, k_{max})$，根据聚类大小自动调整。IF 使用保守的污染先验（hi_cont = 0.20）。

损失函数 / 训练策略¶

RCAE 使用 MSE 损失 + Adam 优化器（lr=$10^{-3}$），batch size=128，训练 1000 epochs
输入图像归一化并应用边缘掩码和高斯模糊预处理
晶圆图统一缩放到 128×128 像素
使用 MultilabelStratifiedShuffleSplit 确保训练/测试集中各缺陷类型分布一致

实验关键数据¶

主实验¶

在 MixedWM38 数据集（38000+ 晶圆图，38+ 缺陷模式组合）上评估：

嵌入方法	聚类方法	最终/最优 K	NMI ↑	ARI ↑
CAE	K-Means^p	24	0.503±0.00	0.199±0.00
MoCo	K-Means^p	18	0.409±0.00	0.173±0.01
RCAE	K-Means^p	30	0.529±0.00	0.205±0.00
CAE	DeepDPM	25	0.498±0.05	0.218±0.01
MoCo	DeepDPM	30	0.273±0.00	0.117±0.00
RCAE (Ours)	DeepDPM	22	0.543±0.03	0.296±0.00

消融实验¶

配置	关键指标	说明
RCAE vs CAE (K-Means)	NMI: 0.529 vs 0.503	等变编码提升聚类质量
RCAE vs MoCo (K-Means)	NMI: 0.529 vs 0.409	重建学习优于对比学习
DeepDPM vs K-Means (RCAE)	ARI: 0.296 vs 0.205	非参数方法显著优于固定K
MoCo+DeepDPM	NMI: 0.273	对比学习嵌入与DeepDPM不兼容

关键发现¶

RCAE 嵌入配合 DeepDPM 在 NMI 和 ARI 上均达到最优
RCAE 产生的聚类确实展现了旋转不变性——不同旋转角度的相同缺陷模式被正确归入同一聚类
聚类质量与隐空间中缺陷模式的分离度正相关
非参数聚类自动确定了 K=22，无需人工调优
集成异常检测成功识别出了聚类内的异类缺陷（如中心缺陷聚类中的甜甜圈缺陷异常）

亮点与洞察¶

等变性 vs 不变性的优雅设计：编码器使用等变卷积保留方向信息，GroupPooling 将等变变为不变，两者在正确的层次发挥作用
无监督的端到端方案：从嵌入学习到聚类到异常检测，不需要任何标签
实用性强：模型轻量（RCAE 参数量小），训练成本低（单 H100 ~8小时），适合工业部署
集成检测策略稳健：IF 提供全局分区隔离，LOF 捕捉局部密度偏差，AND 融合降低假阳性

局限与展望¶

需要多次运行 DeepDPM：确定合适的初始 K 和最优训练 epoch 需要反复实验
多标签评估困难：NMI 和 ARI 需要将多标签简化为主导标签，可能无法全面反映性能
仅测试单一数据集：仅在 MixedWM38 上验证，泛化能力未知
缺少与更多聚类基线的比较：如 GMM、HDBSCAN 等
非 archival 论文：作为 KGML Bridge 论文，研究深度有限

评分¶

新颖性: ⭐⭐⭐ (组件创新有限，组合有新意)
实验充分度: ⭐⭐⭐ (单一数据集，基线比较有限)
写作质量: ⭐⭐⭐⭐ (清晰易懂，方法描述详细)
价值: ⭐⭐⭐ (工业应用有意义，但作为非归档论文贡献有限)