Robustness of Vision Foundation Models to Common Perturbations¶

会议: CVPR 2026
arXiv: 2604.14973
代码: 无
领域: AI 安全/鲁棒性
关键词: foundation model, robustness, common perturbation, embedding, CLIP, DINOv2

一句话总结¶

首次系统研究视觉基础模型对常见扰动（JPEG 压缩、亮度调节等）的鲁棒性，提出三种鲁棒性度量并形式化五个数学性质，发现基础模型普遍不鲁棒，并提出微调方法改善鲁棒性而不牺牲效用。

视觉基础模型输出图像的嵌入向量用于下游任务，但常见编辑操作（JPEG 压缩、亮度/对比度调整等）会改变嵌入向量。与对抗扰动不同，常见扰动在非对抗的真实场景中频繁发生。三个核心问题：(1) 基础模型本身有多鲁棒？(2) 下游应用有多鲁棒？(3) 如何提升鲁棒性？设计合适的度量来量化鲁棒性是关键挑战。

(1) 提出三种鲁棒性度量并分析其数学性质；(2) 系统评估六个工业级基础模型在九类常见扰动下的鲁棒性；(3) 提出微调方法平衡鲁棒性和效用。

DivergenceRadius 度量: 使用嵌入空间中最小包含球的半径作为鲁棒性度量，满足全部五个期望数学性质（有界域、单调性、最优鲁棒性、最差鲁棒性、旋转不变性），优于余弦相似度和欧氏距离度量（不满足最差鲁棒性性质）。证明余弦相似度度量和欧氏距离度量等价（\(\mathcal{R}_{ed} = \sqrt{\mathcal{R}_{cs}}\)）。
鲁棒性-性能线性关系: 发现下游分类准确率和深度估计 MSE 与图像的鲁棒性值之间近似线性关系，可通过简单线性回归模型准确预测扰动图像的下游性能。
鲁棒性感知微调: 优化目标为鲁棒性损失和效用损失的加权和。鲁棒性目标最小化扰动图像嵌入间的变化，效用目标保持原有下游任务性能。实验证实方法成功提升鲁棒性而不损害效用。

微调损失 = 效用损失（保持原有表示质量）+ \(\alpha\) × 鲁棒性损失（最小化扰动嵌入变化），\(\alpha\) 控制平衡。

评估 CLIP（OpenAI，3 种架构）和 DINOv2（Meta，3 种架构）在 9 类扰动下的表现：

7/10 — 系统性强、理论分析严谨、实际价值明确，是基础模型鲁棒性研究的重要基线工作。