Bridging the Copyright Gap: Do Large Vision-Language Models Recognize and Respect Copyrighted Content?¶
会议: AAAI 2026
arXiv: 2512.21871
代码: https://github.com/bluedream02/CopyGuard
领域: 多模态VLM / AI安全 / 版权合规
关键词: VLM版权合规, 多模态benchmark, 版权通知, CopyGuard, 工具增强防御
一句话总结¶
首次系统评估 LVLM 在多模态上下文中对版权内容的识别和遵守能力,构建了 50,000 对多模态查询-内容的大规模 benchmark,发现 11/12 个 SOTA LVLM 即使面对明确版权声明也无法有效拒绝侵权请求,并提出 CopyGuard 工具增强框架将侵权拒绝率从 ~3% 提升至 ~62%。
研究背景与动机¶
- 领域现状:LVLM(如 GPT-4o、Gemini、Claude)广泛用于多模态 RAG、Web Agent、搜索引擎等场景,不可避免地会接触到版权内容(书籍摘录、新闻、歌词、代码文档等),但这些模型对版权的识别和遵守能力几乎未被系统研究。
- 现有痛点:LVLM 在拒绝直接侵权请求(如"给我写一段哈利波特")时表现尚可,但当版权内容以图像形式出现在上下文中(如 RAG 检索到的书页截图),模型会毫无顾忌地复制、翻译、改述这些内容——即使图片中明确标注了"©"版权声明。
- 核心矛盾:现有 LVLM 的安全对齐主要针对暴力/色情等粗粒度风险,缺乏版权意识;而版权法规复杂(不同材料、不同国家、fair use 例外),简单的 fine-tuning 容易导致过度拒绝。
- 本文要解决什么:三个研究问题——RQ1: LVLM 在多模态上下文中的版权合规表现如何?RQ2: 版权声明是否影响模型行为?RQ3: 如何增强 LVLM 的版权合规能力?
- 切入角度:将版权内容转为图像(模拟 RAG/截图场景),评估 LVLM 在重复、提取、改述、翻译四种侵权场景下的行为,涵盖有/无版权声明的情况。
- 核心 idea 一句话:构建大规模版权合规 benchmark + 提出工具增强的 CopyGuard 防御框架(OCR + 搜索验证版权 + 查询风险分析 + 合规提醒)。
方法详解¶
整体框架¶
工作分两部分:(1) 构建 benchmark 系统评估 12 个 LVLM 的版权合规能力;(2) 提出 CopyGuard 防御框架,在 LVLM 推理前进行版权检查和风险提醒。
关键设计¶
- Benchmark 构建:
- 做什么:构建 50,000 对多模态查询-内容配对,覆盖 4 类版权材料 × 5 种版权声明形式 × 4 种侵权任务 × 多种查询
- 核心思路:250 个版权材料来源(100 本书 + 50 篇新闻 + 50 首歌词 + 50 份代码文档),每个材料配 5 种版权声明形式(无声明、文字"All Rights Reserved"、文字原始声明、图片"All Rights Reserved"、图片原始声明),4 种侵权任务(重复、提取、改述、翻译),每任务 10 个查询变体
-
设计动机:覆盖真实世界版权材料的多样性和版权声明的不同呈现方式
-
评估指标体系:
- 做什么:从两个维度评估版权合规——内容相似度 + 拒绝率
- 核心思路:重复/提取任务用 ROUGE-L 衡量文本复制程度;改述用 BERTScore 衡量语义相似度;翻译用多语言 XLM-R embedding cosine similarity;拒绝率用 GPT-4 自动判断模型是否拒绝了请求
-
设计动机:不同侵权方式需要不同的度量——逐字复制和语义层面的复制是两种不同的侵权形式
-
CopyGuard 防御框架:
- 做什么:在 LVLM 推理前检测版权风险并提供合规提醒
- 核心思路:四个组件并行工作——
- Copyright Notice Identifier:用 PaddleOCR 提取图像中的文字,检测版权声明(©、Copyright、All Rights Reserved)
- Copyright Status Verifier:如果没有版权声明,通过 Google Search API 识别文本来源,用 DeepSeek-R1 验证当前版权状态(是否过期)
- Query Risk Analyzer:分析用户查询是否可能导致侵权(如"重复"是侵权,"总结"是合理使用),并建议改写
- Copyright Status Reminder:当检测到侵权风险时,向 LVLM 提供清晰的版权警告通知
- 设计动机:单独依赖 fine-tuning 会导致过度拒绝,工具增强方法可以实时查询版权状态,适应版权法的动态变化
延迟优化¶
CopyGuard 的四个组件可并行执行:OCR+搜索(\(T_1\))和查询风险分析(\(T_2\))同时进行,额外延迟仅为 \(\max(T_1, T_2)\)。如果未检测到风险则无额外开销。
实验关键数据¶
主实验(无版权声明时的拒绝率)¶
| 模型 | 重复 (%) | 提取 (%) | 改述 (%) | 翻译 (%) | 平均 |
|---|---|---|---|---|---|
| GPT-4o | 90.65 | 52.78 | 7.84 | 95.36 | 61.66 |
| GPT-4o-mini | 69.31 | 2.10 | 5.66 | 11.82 | 22.22 |
| Gemini-2.0 | 0.09 | 1.25 | 0.04 | 1.06 | 0.61 |
| Claude-3.7 | 21.86 | 0.03 | 2.03 | 2.79 | 6.68 |
| Qwen2.5-VL-7B | 2.35 | 2.39 | 1.32 | 3.98 | 2.51 |
CopyGuard 效果¶
| 模型 | 原始拒绝率 | + CopyGuard 拒绝率 | 提升 |
|---|---|---|---|
| GPT-4o-mini | 22.22% | 66.40% | +44.18% |
| GPT-4o | 61.66% | 76.79% | +15.13% |
| Gemini-2.0 | 0.61% | 61.61% | +61.00% |
| Claude-3.7 | 6.68% | 63.66% | +56.98% |
| LLaVA-1.5-7B | 5.08% | 79.76% | +74.68% |
| Qwen2.5-VL-7B | 2.51% | 54.54% | +52.03% |
关键发现¶
- 11/12 个 LVLM 在无版权声明时几乎不拒绝侵权请求:除 GPT-4o 外,多数模型的拒绝率低于 10%,Gemini-2.0 仅 0.61%
- 版权声明有一定帮助但远远不够:9/12 模型在加上版权声明后有改善,但多数拒绝率仍低于 5%。只有 GPT-4o/GPT-4o-mini/Claude 有明显响应
- 详细版权声明比"All Rights Reserved"更有效:原始版权声明(含作者、年份)比通用声明导致更低的 ROUGE-L 分数
- CopyGuard 无误报:在非版权内容和非侵权查询(总结、评论等)上零拒绝,在 MMMU/MMBench 等标准 benchmark 上不影响模型性能
- 代码文档是最脆弱的版权材料类别:几乎没有模型能拒绝对代码文档的侵权请求
- 模型架构比规模更影响版权合规:同为 7B 的 Qwen/DeepSeek/Janus 表现差异很大
亮点与洞察¶
- 首次系统化研究 LVLM 的版权合规问题,填补了 LLM 版权研究向多模态方向的空白
- 50,000 个多模态对的大规模 benchmark 设计精细——5 种版权声明形式 × 4 种侵权方式的交叉覆盖非常完整
- CopyGuard 的工具增强思路避免了 fine-tuning 的过度拒绝问题,且可以适应版权状态的动态变化(版权可能过期)——这是 fine-tuning 无法做到的
- 发现 LVLM 对视觉模态中版权声明的"选择性忽视"是一个重要的安全发现——模型在文本中看到"©"会拒绝,但在图片中看到同样的标记却忽略
局限性 / 可改进方向¶
- CopyGuard 依赖外部工具(Google Search、DeepSeek-R1),有网络延迟和 API 成本
- 版权法各国不同,benchmark 主要基于美国版权法,泛化性有限
- 对 fair use 的定义较简单("总结=不侵权,复制/翻译=侵权"),实际法律判断更复杂
- 只评估了文本-图像内容,未覆盖音频/视频等其他多模态版权材料
- CopyGuard 在改述任务上的防御效果相对较弱(GPT-4o-mini 从 5.66% 仅升至 26.84%)
相关工作与启发¶
- vs CopyBench (LLM):CopyBench 评估 LLM 的纯文本版权合规,本文扩展到多模态场景(图像中的版权内容),更贴近 RAG 实际使用
- vs LlamaGuard:LlamaGuard 做通用安全护栏,CopyGuard 做版权特化的护栏,两者可以叠加使用
- 对 RAG 系统的启示:多模态 RAG 系统需要在检索阶段就进行版权检查,而不是等到 LVLM 生成时才判断
评分¶
- 新颖性: ⭐⭐⭐⭐ 首次系统研究 LVLM 版权合规是新颖的,但 CopyGuard 框架的技术创新性一般(工具组合)
- 实验充分度: ⭐⭐⭐⭐⭐ 12 个模型 + 50K 数据集 + 4 种侵权场景 + 5 种版权声明 + 标准 benchmark 无害验证,非常全面
- 写作质量: ⭐⭐⭐⭐ 问题定义清晰,研究设计严谨,附录非常详细
- 价值: ⭐⭐⭐⭐⭐ 版权合规是 AI 部署的法律刚需,benchmark 和 CopyGuard 有直接实用价值