LIDA: Attribution as Retrieval — Model-Agnostic AI-Generated Image Attribution¶
日期: 2026-03-11
arXiv: 2603.10583
代码: github.com/hongsong-wang/LIDA
领域: 图像生成 / AI安全
关键词: deepfake attribution, image forensics, instance retrieval, low-bit fingerprint, few-shot
一句话总结¶
将 AI 生成图像归因问题从分类重新定义为实例检索问题,提出 LIDA 框架——通过低位平面指纹提取 + 无监督预训练 + 少样本归因适配,实现模型无关的零样本/少样本深伪检测和归因 SOTA。
研究背景与动机¶
-
领域现状: AIGC 快速发展使得合成媒体日益逼真,需要可靠的 AI 生成图像检测和归因技术判断图像来源模型。
-
现有痛点: 生成图像水印需要访问生成模型;闭集归因方法要求训练时已知所有生成器;开集方法也将其视为分类问题,难以扩展到新生成器。
-
核心矛盾: 生成模型快速迭代,归因系统必须能零成本扩展到未见过的生成器。
-
核心 idea: 将归因重构为检索问题——只需训练一个编码器,新生成器只需注册几张样本图像到数据库即可归因。低位平面携带生成器指纹。
方法详解¶
整体框架¶
三模块 pipeline:(1) 低位指纹生成——提取 RGB 各通道低位平面组合成指纹图 (2) 无监督预训练——在大规模真实图像上用 pretext task 训练轻量编码器 (3) 少样本归因适配——用少量 AI 生成图像微调。
关键设计¶
-
低位平面指纹生成 (Low-Bit Fingerprint):
- 提取每个 RGB 通道的低位平面(LSB 级别)
- 生成器的指纹主要残留在低位平面而非高位视觉内容
- 显式分离生成器特征和图像内容,提升泛化性
-
无监督预训练:
- 在大规模真实图像上训练轻量编码器
- 用 pretext task + side loss 学习通用的低位模式表示
- 不需要任何 AI 生成图像——增强对未知生成器的泛化
-
少样本归因适配:
- 仅需每个生成器几张注册图像
- 同时优化归因损失(区分不同生成器)和检测损失(区分真假)
- 检索时比较查询图编码与注册数据库的相似度
实验关键数据¶
主实验 — GenImage 数据集¶
| 方法 | 零样本检测 AUC | 少样本归因 Acc |
|---|---|---|
| CNNDetection | ~80% | — |
| UnivFD | ~85% | — |
| LIDA (zero-shot) | ~90%+ | — |
| LIDA (few-shot) | — | SOTA |
跨架构/跨生成器消融¶
| 设置 | 性能 |
|---|---|
| 训练:GAN → 测试:扩散模型 | 保持高精度 |
| 训练:闭集5类 → 测试:开集新生成器 | 检索式归因仍有效 |
| 无低位指纹(用原图) | 显著下降 |
| 无无监督预训练 | 少样本泛化变差 |
关键发现¶
- 低位平面是区分不同生成器的核心信号——高位内容反而是噪声
- 检索范式天然支持开集扩展——新生成器只需注册几张图
- 跨架构泛化(GAN→DM)能力强——说明低位指纹对生成范式无关
- 无监督预训练在真实图像上的表示是关键——few-shot 效果远超直接训练
亮点与洞察¶
- 范式转换: 从分类→检索的重构让归因系统天然可扩展,不需为新生成器重训
- 低位平面的洞察: 简单但深刻——生成器指纹藏在人眼看不到的低位中
- 实用性极高: 注册新生成器只需几张图片,无需访问模型
局限性 / 可改进方向¶
- 低位平面可能受图像后处理(压缩、裁剪)影响
- 轻量编码器容量有限,极大规模注册数据库的检索效率待验证
- 仅验证图像,视频生成归因未探索
评分¶
- 新颖性: ⭐⭐⭐⭐⭐ 检索范式+低位平面指纹是全新思路
- 实验充分度: ⭐⭐⭐⭐ 零/少样本+跨架构+跨生成器全面验证
- 写作质量: ⭐⭐⭐⭐ 动机和方法表述清晰
- 价值: ⭐⭐⭐⭐⭐ 对 AIGC 内容治理有直接实用价值