LIDA: Attribution as Retrieval — Model-Agnostic AI-Generated Image Attribution¶

日期: 2026-03-11
arXiv: 2603.10583
代码: github.com/hongsong-wang/LIDA
领域: 图像生成 / AI安全
关键词: deepfake attribution, image forensics, instance retrieval, low-bit fingerprint, few-shot

一句话总结¶

将 AI 生成图像归因问题从分类重新定义为实例检索问题，提出 LIDA 框架——通过低位平面指纹提取 + 无监督预训练 + 少样本归因适配，实现模型无关的零样本/少样本深伪检测和归因 SOTA。

研究背景与动机¶

领域现状: AIGC 快速发展使得合成媒体日益逼真，需要可靠的 AI 生成图像检测和归因技术判断图像来源模型。
现有痛点: 生成图像水印需要访问生成模型；闭集归因方法要求训练时已知所有生成器；开集方法也将其视为分类问题，难以扩展到新生成器。
核心矛盾: 生成模型快速迭代，归因系统必须能零成本扩展到未见过的生成器。
核心 idea: 将归因重构为检索问题——只需训练一个编码器，新生成器只需注册几张样本图像到数据库即可归因。低位平面携带生成器指纹。

方法详解¶

整体框架¶

三模块 pipeline：(1) 低位指纹生成——提取 RGB 各通道低位平面组合成指纹图 (2) 无监督预训练——在大规模真实图像上用 pretext task 训练轻量编码器 (3) 少样本归因适配——用少量 AI 生成图像微调。

关键设计¶

低位平面指纹生成 (Low-Bit Fingerprint):
- 提取每个 RGB 通道的低位平面（LSB 级别）
- 生成器的指纹主要残留在低位平面而非高位视觉内容
- 显式分离生成器特征和图像内容，提升泛化性
无监督预训练:
- 在大规模真实图像上训练轻量编码器
- 用 pretext task + side loss 学习通用的低位模式表示
- 不需要任何 AI 生成图像——增强对未知生成器的泛化
少样本归因适配:
- 仅需每个生成器几张注册图像
- 同时优化归因损失（区分不同生成器）和检测损失（区分真假）
- 检索时比较查询图编码与注册数据库的相似度

实验关键数据¶

主实验 — GenImage 数据集¶

方法	零样本检测 AUC	少样本归因 Acc
CNNDetection	~80%	—
UnivFD	~85%	—
LIDA (zero-shot)	~90%+	—
LIDA (few-shot)	—	SOTA

跨架构/跨生成器消融¶

设置	性能
训练:GAN → 测试:扩散模型	保持高精度
训练:闭集5类 → 测试:开集新生成器	检索式归因仍有效
无低位指纹（用原图）	显著下降
无无监督预训练	少样本泛化变差

关键发现¶

低位平面是区分不同生成器的核心信号——高位内容反而是噪声
检索范式天然支持开集扩展——新生成器只需注册几张图
跨架构泛化（GAN→DM）能力强——说明低位指纹对生成范式无关
无监督预训练在真实图像上的表示是关键——few-shot 效果远超直接训练

亮点与洞察¶

范式转换: 从分类→检索的重构让归因系统天然可扩展，不需为新生成器重训
低位平面的洞察: 简单但深刻——生成器指纹藏在人眼看不到的低位中
实用性极高: 注册新生成器只需几张图片，无需访问模型

局限性 / 可改进方向¶

低位平面可能受图像后处理（压缩、裁剪）影响
轻量编码器容量有限，极大规模注册数据库的检索效率待验证
仅验证图像，视频生成归因未探索

评分¶

新颖性: ⭐⭐⭐⭐⭐ 检索范式+低位平面指纹是全新思路
实验充分度: ⭐⭐⭐⭐ 零/少样本+跨架构+跨生成器全面验证
写作质量: ⭐⭐⭐⭐ 动机和方法表述清晰
价值: ⭐⭐⭐⭐⭐ 对 AIGC 内容治理有直接实用价值