Attribution as Retrieval: Model-Agnostic AI-Generated Image Attribution¶

会议: CVPR 2026
arXiv: 2603.10583
代码: 有
领域: AI 生成图像取证 / 图像检索
关键词: AIGC 归因、实例检索、低位平面指纹、少样本学习、Deepfake 检测

一句话总结¶

将 AI 生成图像归因从分类范式重新定义为实例检索问题，提出 LIDA 框架：利用低位平面提取生成器指纹，通过无监督预训练 + 少样本适配实现开放集归因，在 GenImage 和 WildFake 上全面超越现有方法。

传统 AI 生成图像归因方法将其视为分类问题——已知所有生成器并训练分类器。但生成模型快速迭代，分类范式需要为每个新模型收集数据重新训练，无法适应开放集场景。水印方法则需要访问和修改生成模型本身。需要一个不依赖生成模型、仅需少量示例即可适配新生成器的通用框架。

如何设计一个模型无关、无需大量再训练、仅需少量注册图像即可适配新生成器的通用 AIGC 归因框架？

维护一个注册数据库（每个生成器仅几张图像），训练特征编码器将查询图像映射到统一特征空间，通过余弦相似度检索最近邻来归因。关键：输入不是原始 RGB 图像，而是低位平面指纹。

低位平面指纹生成: 对 RGB 图像每通道取最低 3 个位平面（k=0,1,2），用符号函数二值化。生成器隐性 artifacts 在 RGB 空间被淹没，但在低位平面中清晰可分——PCA 可视化显示不同生成器指纹自然聚类
无监督预训练: 用 ImageNet 真实图像的低位指纹训练改造 ResNet-50（去除浅层下采样保留空间细节），以 ImageNet 分类为 pretext task，学习通用噪声结构表示
少样本归因适配: Center loss 聚合同类 + 真实原型对比损失分离真/假。刻意避免交叉熵以保护预训练特征空间结构。最终损失权重 lambda=0.9

数据集	设置	Rank-1	之前最佳	提升
GenImage (cross-arch)	10-shot	49.7%	18.0% (ESSP)	+31.7%
WildFake (cross-arch)	10-shot	62.3%	31.5% (DIRE)	+30.8%
GenImage (cross-gen)	1-shot	77.5%	37.4% (ResNet)	+40.1%
GenImage	0-shot检测	ACC 86.3%	77.1% (FSD)	+9.2%
GenImage	10-shot检测	ACC 88.3%	84.1% (FSD)	+4.2%