跳转至

Bridging the Copyright Gap: Do Large Vision-Language Models Recognize and Respect Copyrighted Content?

会议: AAAI 2026
arXiv: 2512.21871
代码: https://github.com/bluedream02/CopyGuard
领域: 多模态VLM / AI安全 / 版权合规
关键词: VLM版权合规, 多模态benchmark, 版权通知, CopyGuard, 工具增强防御

一句话总结

首次系统评估 LVLM 在多模态上下文中对版权内容的识别和遵守能力,构建了 50,000 对多模态查询-内容的大规模 benchmark,发现 11/12 个 SOTA LVLM 即使面对明确版权声明也无法有效拒绝侵权请求,并提出 CopyGuard 工具增强框架将侵权拒绝率从 ~3% 提升至 ~62%。

研究背景与动机

  1. 领域现状:LVLM(如 GPT-4o、Gemini、Claude)广泛用于多模态 RAG、Web Agent、搜索引擎等场景,不可避免地会接触到版权内容(书籍摘录、新闻、歌词、代码文档等),但这些模型对版权的识别和遵守能力几乎未被系统研究。
  2. 现有痛点:LVLM 在拒绝直接侵权请求(如"给我写一段哈利波特")时表现尚可,但当版权内容以图像形式出现在上下文中(如 RAG 检索到的书页截图),模型会毫无顾忌地复制、翻译、改述这些内容——即使图片中明确标注了"©"版权声明。
  3. 核心矛盾:现有 LVLM 的安全对齐主要针对暴力/色情等粗粒度风险,缺乏版权意识;而版权法规复杂(不同材料、不同国家、fair use 例外),简单的 fine-tuning 容易导致过度拒绝。
  4. 本文要解决什么:三个研究问题——RQ1: LVLM 在多模态上下文中的版权合规表现如何?RQ2: 版权声明是否影响模型行为?RQ3: 如何增强 LVLM 的版权合规能力?
  5. 切入角度:将版权内容转为图像(模拟 RAG/截图场景),评估 LVLM 在重复、提取、改述、翻译四种侵权场景下的行为,涵盖有/无版权声明的情况。
  6. 核心 idea 一句话:构建大规模版权合规 benchmark + 提出工具增强的 CopyGuard 防御框架(OCR + 搜索验证版权 + 查询风险分析 + 合规提醒)。

方法详解

整体框架

工作分两部分:(1) 构建 benchmark 系统评估 12 个 LVLM 的版权合规能力;(2) 提出 CopyGuard 防御框架,在 LVLM 推理前进行版权检查和风险提醒。

关键设计

  1. Benchmark 构建:
  2. 做什么:构建 50,000 对多模态查询-内容配对,覆盖 4 类版权材料 × 5 种版权声明形式 × 4 种侵权任务 × 多种查询
  3. 核心思路:250 个版权材料来源(100 本书 + 50 篇新闻 + 50 首歌词 + 50 份代码文档),每个材料配 5 种版权声明形式(无声明、文字"All Rights Reserved"、文字原始声明、图片"All Rights Reserved"、图片原始声明),4 种侵权任务(重复、提取、改述、翻译),每任务 10 个查询变体
  4. 设计动机:覆盖真实世界版权材料的多样性和版权声明的不同呈现方式

  5. 评估指标体系:

  6. 做什么:从两个维度评估版权合规——内容相似度 + 拒绝率
  7. 核心思路:重复/提取任务用 ROUGE-L 衡量文本复制程度;改述用 BERTScore 衡量语义相似度;翻译用多语言 XLM-R embedding cosine similarity;拒绝率用 GPT-4 自动判断模型是否拒绝了请求
  8. 设计动机:不同侵权方式需要不同的度量——逐字复制和语义层面的复制是两种不同的侵权形式

  9. CopyGuard 防御框架:

  10. 做什么:在 LVLM 推理前检测版权风险并提供合规提醒
  11. 核心思路:四个组件并行工作——
    • Copyright Notice Identifier:用 PaddleOCR 提取图像中的文字,检测版权声明(©、Copyright、All Rights Reserved)
    • Copyright Status Verifier:如果没有版权声明,通过 Google Search API 识别文本来源,用 DeepSeek-R1 验证当前版权状态(是否过期)
    • Query Risk Analyzer:分析用户查询是否可能导致侵权(如"重复"是侵权,"总结"是合理使用),并建议改写
    • Copyright Status Reminder:当检测到侵权风险时,向 LVLM 提供清晰的版权警告通知
  12. 设计动机:单独依赖 fine-tuning 会导致过度拒绝,工具增强方法可以实时查询版权状态,适应版权法的动态变化

延迟优化

CopyGuard 的四个组件可并行执行:OCR+搜索(\(T_1\))和查询风险分析(\(T_2\))同时进行,额外延迟仅为 \(\max(T_1, T_2)\)。如果未检测到风险则无额外开销。

实验关键数据

主实验(无版权声明时的拒绝率)

模型 重复 (%) 提取 (%) 改述 (%) 翻译 (%) 平均
GPT-4o 90.65 52.78 7.84 95.36 61.66
GPT-4o-mini 69.31 2.10 5.66 11.82 22.22
Gemini-2.0 0.09 1.25 0.04 1.06 0.61
Claude-3.7 21.86 0.03 2.03 2.79 6.68
Qwen2.5-VL-7B 2.35 2.39 1.32 3.98 2.51

CopyGuard 效果

模型 原始拒绝率 + CopyGuard 拒绝率 提升
GPT-4o-mini 22.22% 66.40% +44.18%
GPT-4o 61.66% 76.79% +15.13%
Gemini-2.0 0.61% 61.61% +61.00%
Claude-3.7 6.68% 63.66% +56.98%
LLaVA-1.5-7B 5.08% 79.76% +74.68%
Qwen2.5-VL-7B 2.51% 54.54% +52.03%

关键发现

  • 11/12 个 LVLM 在无版权声明时几乎不拒绝侵权请求:除 GPT-4o 外,多数模型的拒绝率低于 10%,Gemini-2.0 仅 0.61%
  • 版权声明有一定帮助但远远不够:9/12 模型在加上版权声明后有改善,但多数拒绝率仍低于 5%。只有 GPT-4o/GPT-4o-mini/Claude 有明显响应
  • 详细版权声明比"All Rights Reserved"更有效:原始版权声明(含作者、年份)比通用声明导致更低的 ROUGE-L 分数
  • CopyGuard 无误报:在非版权内容和非侵权查询(总结、评论等)上零拒绝,在 MMMU/MMBench 等标准 benchmark 上不影响模型性能
  • 代码文档是最脆弱的版权材料类别:几乎没有模型能拒绝对代码文档的侵权请求
  • 模型架构比规模更影响版权合规:同为 7B 的 Qwen/DeepSeek/Janus 表现差异很大

亮点与洞察

  • 首次系统化研究 LVLM 的版权合规问题,填补了 LLM 版权研究向多模态方向的空白
  • 50,000 个多模态对的大规模 benchmark 设计精细——5 种版权声明形式 × 4 种侵权方式的交叉覆盖非常完整
  • CopyGuard 的工具增强思路避免了 fine-tuning 的过度拒绝问题,且可以适应版权状态的动态变化(版权可能过期)——这是 fine-tuning 无法做到的
  • 发现 LVLM 对视觉模态中版权声明的"选择性忽视"是一个重要的安全发现——模型在文本中看到"©"会拒绝,但在图片中看到同样的标记却忽略

局限性 / 可改进方向

  • CopyGuard 依赖外部工具(Google Search、DeepSeek-R1),有网络延迟和 API 成本
  • 版权法各国不同,benchmark 主要基于美国版权法,泛化性有限
  • 对 fair use 的定义较简单("总结=不侵权,复制/翻译=侵权"),实际法律判断更复杂
  • 只评估了文本-图像内容,未覆盖音频/视频等其他多模态版权材料
  • CopyGuard 在改述任务上的防御效果相对较弱(GPT-4o-mini 从 5.66% 仅升至 26.84%)

相关工作与启发

  • vs CopyBench (LLM):CopyBench 评估 LLM 的纯文本版权合规,本文扩展到多模态场景(图像中的版权内容),更贴近 RAG 实际使用
  • vs LlamaGuard:LlamaGuard 做通用安全护栏,CopyGuard 做版权特化的护栏,两者可以叠加使用
  • 对 RAG 系统的启示:多模态 RAG 系统需要在检索阶段就进行版权检查,而不是等到 LVLM 生成时才判断

评分

  • 新颖性: ⭐⭐⭐⭐ 首次系统研究 LVLM 版权合规是新颖的,但 CopyGuard 框架的技术创新性一般(工具组合)
  • 实验充分度: ⭐⭐⭐⭐⭐ 12 个模型 + 50K 数据集 + 4 种侵权场景 + 5 种版权声明 + 标准 benchmark 无害验证,非常全面
  • 写作质量: ⭐⭐⭐⭐ 问题定义清晰,研究设计严谨,附录非常详细
  • 价值: ⭐⭐⭐⭐⭐ 版权合规是 AI 部署的法律刚需,benchmark 和 CopyGuard 有直接实用价值