GeoChemAD: Benchmarking Unsupervised Geochemical Anomaly Detection for Mineral Exploration¶

会议: CVPR 2026
arXiv: 2603.13068
代码: github.com/yihaoding/geochemad
领域: 异常检测 / 地球科学 / 自监督学习
关键词: 地球化学异常检测, 矿产勘探, 基准数据集, 自监督预训练, Transformer

一句话总结¶

发布首个开源多区域多元素地球化学异常检测基准 GeoChemAD（8 子集，覆盖沉积物/岩屑/土壤三类采样源和 Au/Cu/Ni/W 四种目标元素），并提出 GeoChemFormer——两阶段 Transformer 框架，先学空间上下文再做元素依赖建模，平均 AUC 达 0.7712 超越所有基线。

背景与动机¶

地球化学异常检测是矿产勘探的核心步骤：表层采样浓度偏离区域基线可能指示矿化。现有研究受限于两大问题：(1) 绝大多数方法仅在单一区域场景（通常中国地质调查的金矿数据）上评估，模型泛化性无法衡量；(2) 几乎所有数据集为闭源/私有，研究成果无法复现和公平比较。此外，无监督方法虽在泛化性上有优势，但检测到的异常可能与目标矿化元素无关。

核心问题¶

如何构建一个标准化、可复现的无监督地球化学异常检测基准？如何设计一个既能感知空间上下文又能区分目标元素相关异常的无监督检测框架？

方法详解¶

整体框架¶

GeoChemFormer 分两阶段：Stage 1（空间上下文学习 SCL）学习局部地球化学协变模式的潜在表示；Stage 2（元素依赖建模）基于学到的空间上下文检测异常。

关键设计¶

GeoChemAD 数据集：来自西澳大利亚地质调查局（GSWA）的政府公开数据，包含 8 个子集——2 个沉积物（sed1/sed2）、3 个岩屑（rock1/2/3）、3 个土壤（soil1/2/3），覆盖面积从 6 km² 到 8500 km²，采样点数 224 到 21040，对应四种目标矿化元素 Au/Cu/Ni/W。每个子集提供地球化学浓度 CSV 和已知矿化位点 CSV。
Stage 1 空间上下文学习：对每个查询位置 \(p_i\)，用 KD-tree 检索 \(K\) 个最近邻。构建 token 序列 \(\mathcal{S}=[e, q_i, t_1,...,t_K]\)（目标元素 token + 查询位置 token + 邻域 token），通过 \(L\) 层 Transformer 编码器学习空间上下文表示 \(q_i'\)。自监督目标：仅从邻域预测查询位置的目标元素浓度，损失 \(\mathcal{L}_{sc} = \frac{1}{N}\sum({\hat{y}_i - y_i})^2\)。
Stage 2 元素依赖建模：输入序列 \(\mathcal{S}'=[W_g q_i', u_1,...,u_c]\)（geo-context token + \(c\) 个元素 token）。每个元素 token 由元素身份 embedding 和标量浓度值拼接投影而成。Transformer 编码器学习条件于空间上下文的元素间依赖。异常得分为所有元素的重建 MSE：\(s_i = \frac{1}{C}\sum_{c}(x_{i,c}-\hat{x}_{i,c})^2\)。
数据预处理模块：处理异常值（-9999 等）、闭合问题（CLR/ILR 变换）、特征选择（手动/PCA/因果发现/LLM 辅助）、空间插值（IDW/Kriging）。

损失函数 / 训练策略¶

Stage 1：MSE 回归损失（预测目标元素浓度）
Stage 2：MSE 重建损失（重建所有元素浓度）
PyTorch 实现，单卡 NVIDIA RTX A6000 (48 GB)
评估指标：AUC（20 次随机背景采样取平均）

实验关键数据¶

方法类别	代表方法	平均 AUC
统计方法	Z-score / Mahalanobis / KNN	0.50-0.58
经典 ML	Isolation Forest / One-Class SVM	~0.58-0.62
深度生成	AE / VAE / VAE-GAN	0.70-0.73
Transformer	Vanilla Transformer (T1)	0.7147
GeoChemFormer (T2)	本文	0.7712

GeoChemFormer 在 8 个子集中的 6 个上达到最优，sed2 上 IF 和 OSVM 更好（AUC 0.77-0.80 vs 0.73），rock2 上 AE 更好（0.92 vs 0.83）。这说明不同地质条件下最优方法各异。

消融实验要点¶

SCL 预训练轮数：rock2 在 20 epochs 即达峰值 (0.919)，sed1 在 40 epochs (0.743)，soil2 需 60 epochs (0.821)
邻域大小 K：sed1 随 K 增大单调提升（16→256, 0.591→0.720），rock2/soil2 在 K=32/16 达峰后下降——沉积物异常需广域上下文，岩屑和土壤需紧凑局部邻域
闭合变换：ILR 最优（平均 0.6788），CLR 次之（0.6771），Raw 最差（0.6406）
特征选择：LLM 辅助选择整体最佳（0.7412 vs 手动 0.6419），PCA 在 GeoChemFormer 上最高（0.9427）
插值方法：效果受数据特性主导而非模型架构

亮点¶

首个开源多区域多采样源的地球化学异常检测基准，填补了该领域标准化评估的空白
两阶段 Transformer 设计精巧：空间上下文学习使模型感知地理环境，元素依赖建模实现目标元素感知的异常检测
系统评估了多种预处理策略（闭合变换、特征选择、插值方法）的影响，对实际应用有参考价值
LLM 辅助特征选择在地学领域的有效性是一个有趣的发现

局限性¶

数据集来源单一（西澳大利亚），虽多区域但地质背景仍有偏向性
地球化学数据的空间稀疏性和不规则采样限制了深度学习方法的表现
在部分子集上简单方法（IF/AE）更优，说明 GeoChemFormer 的通用优势并非压倒性的
评估仅基于 AUC，缺乏对空间定位精度的深入分析（距离度量仅在 case study 中展示）

与相关工作的对比¶

Yu et al. (NRR 2024)：Transformer 用于地球化学异常识别但缺乏自监督预训练和标准化基准
Luo & Zuo (Math Geosci 2025)：因果发现算法用于金矿异常检测，但闭源数据且单一区域
Scheidt et al. (NRR 2025)：Masked autoregressive flow 用于 Li-Cs-Ta 勘探，数据公开但方法复杂

评分¶

新颖性: ⭐⭐⭐⭐ (首个标准化开源基准+目标元素感知的两阶段框架)
实验充分度: ⭐⭐⭐⭐⭐ (12种基线×8子集×多种预处理策略的系统对比)
写作质量: ⭐⭐⭐⭐ (结构清晰，数据集描述详尽)
价值: ⭐⭐⭐ (跨领域应用，对 CV 社区直接价值有限但数据集贡献显著)