跳转至

LIDA: Attribution as Retrieval — Model-Agnostic AI-Generated Image Attribution

日期: 2026-03-11
arXiv: 2603.10583
代码: github.com/hongsong-wang/LIDA
领域: 图像生成 / AI安全
关键词: deepfake attribution, image forensics, instance retrieval, low-bit fingerprint, few-shot

一句话总结

将 AI 生成图像归因问题从分类重新定义为实例检索问题,提出 LIDA 框架——通过低位平面指纹提取 + 无监督预训练 + 少样本归因适配,实现模型无关的零样本/少样本深伪检测和归因 SOTA。

研究背景与动机

  1. 领域现状: AIGC 快速发展使得合成媒体日益逼真,需要可靠的 AI 生成图像检测和归因技术判断图像来源模型。

  2. 现有痛点: 生成图像水印需要访问生成模型;闭集归因方法要求训练时已知所有生成器;开集方法也将其视为分类问题,难以扩展到新生成器。

  3. 核心矛盾: 生成模型快速迭代,归因系统必须能零成本扩展到未见过的生成器。

  4. 核心 idea: 将归因重构为检索问题——只需训练一个编码器,新生成器只需注册几张样本图像到数据库即可归因。低位平面携带生成器指纹。

方法详解

整体框架

三模块 pipeline:(1) 低位指纹生成——提取 RGB 各通道低位平面组合成指纹图 (2) 无监督预训练——在大规模真实图像上用 pretext task 训练轻量编码器 (3) 少样本归因适配——用少量 AI 生成图像微调。

关键设计

  1. 低位平面指纹生成 (Low-Bit Fingerprint):

    • 提取每个 RGB 通道的低位平面(LSB 级别)
    • 生成器的指纹主要残留在低位平面而非高位视觉内容
    • 显式分离生成器特征和图像内容,提升泛化性
  2. 无监督预训练:

    • 在大规模真实图像上训练轻量编码器
    • 用 pretext task + side loss 学习通用的低位模式表示
    • 不需要任何 AI 生成图像——增强对未知生成器的泛化
  3. 少样本归因适配:

    • 仅需每个生成器几张注册图像
    • 同时优化归因损失(区分不同生成器)和检测损失(区分真假)
    • 检索时比较查询图编码与注册数据库的相似度

实验关键数据

主实验 — GenImage 数据集

方法 零样本检测 AUC 少样本归因 Acc
CNNDetection ~80%
UnivFD ~85%
LIDA (zero-shot) ~90%+
LIDA (few-shot) SOTA

跨架构/跨生成器消融

设置 性能
训练:GAN → 测试:扩散模型 保持高精度
训练:闭集5类 → 测试:开集新生成器 检索式归因仍有效
无低位指纹(用原图) 显著下降
无无监督预训练 少样本泛化变差

关键发现

  • 低位平面是区分不同生成器的核心信号——高位内容反而是噪声
  • 检索范式天然支持开集扩展——新生成器只需注册几张图
  • 跨架构泛化(GAN→DM)能力强——说明低位指纹对生成范式无关
  • 无监督预训练在真实图像上的表示是关键——few-shot 效果远超直接训练

亮点与洞察

  • 范式转换: 从分类→检索的重构让归因系统天然可扩展,不需为新生成器重训
  • 低位平面的洞察: 简单但深刻——生成器指纹藏在人眼看不到的低位中
  • 实用性极高: 注册新生成器只需几张图片,无需访问模型

局限性 / 可改进方向

  • 低位平面可能受图像后处理(压缩、裁剪)影响
  • 轻量编码器容量有限,极大规模注册数据库的检索效率待验证
  • 仅验证图像,视频生成归因未探索

评分

  • 新颖性: ⭐⭐⭐⭐⭐ 检索范式+低位平面指纹是全新思路
  • 实验充分度: ⭐⭐⭐⭐ 零/少样本+跨架构+跨生成器全面验证
  • 写作质量: ⭐⭐⭐⭐ 动机和方法表述清晰
  • 价值: ⭐⭐⭐⭐⭐ 对 AIGC 内容治理有直接实用价值