Bridging the Copyright Gap: Do Large Vision-Language Models Recognize and Respect Copyrighted Content?¶

会议: AAAI 2026
arXiv: 2512.21871
代码: https://github.com/bluedream02/CopyGuard
领域: 多模态VLM / AI安全 / 版权合规
关键词: VLM版权合规, 多模态benchmark, 版权通知, CopyGuard, 工具增强防御

一句话总结¶

研究背景与动机¶

领域现状：LVLM（如 GPT-4o、Gemini、Claude）广泛用于多模态 RAG、Web Agent、搜索引擎等场景，不可避免地会接触到版权内容（书籍摘录、新闻、歌词、代码文档等），但这些模型对版权的识别和遵守能力几乎未被系统研究。
现有痛点：LVLM 在拒绝直接侵权请求（如"给我写一段哈利波特"）时表现尚可，但当版权内容以图像形式出现在上下文中（如 RAG 检索到的书页截图），模型会毫无顾忌地复制、翻译、改述这些内容——即使图片中明确标注了"©"版权声明。
核心矛盾：现有 LVLM 的安全对齐主要针对暴力/色情等粗粒度风险，缺乏版权意识；而版权法规复杂（不同材料、不同国家、fair use 例外），简单的 fine-tuning 容易导致过度拒绝。
本文要解决什么：三个研究问题——RQ1: LVLM 在多模态上下文中的版权合规表现如何？RQ2: 版权声明是否影响模型行为？RQ3: 如何增强 LVLM 的版权合规能力？
切入角度：将版权内容转为图像（模拟 RAG/截图场景），评估 LVLM 在重复、提取、改述、翻译四种侵权场景下的行为，涵盖有/无版权声明的情况。
核心 idea 一句话：构建大规模版权合规 benchmark + 提出工具增强的 CopyGuard 防御框架（OCR + 搜索验证版权 + 查询风险分析 + 合规提醒）。

方法详解¶

整体框架¶

工作分两部分：(1) 构建 benchmark 系统评估 12 个 LVLM 的版权合规能力；(2) 提出 CopyGuard 防御框架，在 LVLM 推理前进行版权检查和风险提醒。

关键设计¶

Benchmark 构建:
做什么：构建 50,000 对多模态查询-内容配对，覆盖 4 类版权材料 × 5 种版权声明形式 × 4 种侵权任务 × 多种查询
核心思路：250 个版权材料来源（100 本书 + 50 篇新闻 + 50 首歌词 + 50 份代码文档），每个材料配 5 种版权声明形式（无声明、文字"All Rights Reserved"、文字原始声明、图片"All Rights Reserved"、图片原始声明），4 种侵权任务（重复、提取、改述、翻译），每任务 10 个查询变体
设计动机：覆盖真实世界版权材料的多样性和版权声明的不同呈现方式
评估指标体系:
做什么：从两个维度评估版权合规——内容相似度 + 拒绝率
核心思路：重复/提取任务用 ROUGE-L 衡量文本复制程度；改述用 BERTScore 衡量语义相似度；翻译用多语言 XLM-R embedding cosine similarity；拒绝率用 GPT-4 自动判断模型是否拒绝了请求
设计动机：不同侵权方式需要不同的度量——逐字复制和语义层面的复制是两种不同的侵权形式
CopyGuard 防御框架:
做什么：在 LVLM 推理前检测版权风险并提供合规提醒
核心思路：四个组件并行工作——
- Copyright Notice Identifier：用 PaddleOCR 提取图像中的文字，检测版权声明（©、Copyright、All Rights Reserved）
- Copyright Status Verifier：如果没有版权声明，通过 Google Search API 识别文本来源，用 DeepSeek-R1 验证当前版权状态（是否过期）
- Query Risk Analyzer：分析用户查询是否可能导致侵权（如"重复"是侵权，"总结"是合理使用），并建议改写
- Copyright Status Reminder：当检测到侵权风险时，向 LVLM 提供清晰的版权警告通知
设计动机：单独依赖 fine-tuning 会导致过度拒绝，工具增强方法可以实时查询版权状态，适应版权法的动态变化

延迟优化¶

CopyGuard 的四个组件可并行执行：OCR+搜索（\(T_1\)）和查询风险分析（\(T_2\)）同时进行，额外延迟仅为 \(\max(T_1, T_2)\)。如果未检测到风险则无额外开销。

实验关键数据¶

主实验（无版权声明时的拒绝率）¶

模型	重复 (%)	提取 (%)	改述 (%)	翻译 (%)	平均
GPT-4o	90.65	52.78	7.84	95.36	61.66
GPT-4o-mini	69.31	2.10	5.66	11.82	22.22
Gemini-2.0	0.09	1.25	0.04	1.06	0.61
Claude-3.7	21.86	0.03	2.03	2.79	6.68
Qwen2.5-VL-7B	2.35	2.39	1.32	3.98	2.51

CopyGuard 效果¶

模型	原始拒绝率	+ CopyGuard 拒绝率	提升
GPT-4o-mini	22.22%	66.40%	+44.18%
GPT-4o	61.66%	76.79%	+15.13%
Gemini-2.0	0.61%	61.61%	+61.00%
Claude-3.7	6.68%	63.66%	+56.98%
LLaVA-1.5-7B	5.08%	79.76%	+74.68%
Qwen2.5-VL-7B	2.51%	54.54%	+52.03%

关键发现¶

11/12 个 LVLM 在无版权声明时几乎不拒绝侵权请求：除 GPT-4o 外，多数模型的拒绝率低于 10%，Gemini-2.0 仅 0.61%
版权声明有一定帮助但远远不够：9/12 模型在加上版权声明后有改善，但多数拒绝率仍低于 5%。只有 GPT-4o/GPT-4o-mini/Claude 有明显响应
CopyGuard 无误报：在非版权内容和非侵权查询（总结、评论等）上零拒绝，在 MMMU/MMBench 等标准 benchmark 上不影响模型性能
代码文档是最脆弱的版权材料类别：几乎没有模型能拒绝对代码文档的侵权请求
模型架构比规模更影响版权合规：同为 7B 的 Qwen/DeepSeek/Janus 表现差异很大

亮点与洞察¶

首次系统化研究 LVLM 的版权合规问题，填补了 LLM 版权研究向多模态方向的空白
50,000 个多模态对的大规模 benchmark 设计精细——5 种版权声明形式 × 4 种侵权方式的交叉覆盖非常完整
CopyGuard 的工具增强思路避免了 fine-tuning 的过度拒绝问题，且可以适应版权状态的动态变化（版权可能过期）——这是 fine-tuning 无法做到的

局限性 / 可改进方向¶

CopyGuard 依赖外部工具（Google Search、DeepSeek-R1），有网络延迟和 API 成本
版权法各国不同，benchmark 主要基于美国版权法，泛化性有限
对 fair use 的定义较简单（"总结=不侵权，复制/翻译=侵权"），实际法律判断更复杂
只评估了文本-图像内容，未覆盖音频/视频等其他多模态版权材料
CopyGuard 在改述任务上的防御效果相对较弱（GPT-4o-mini 从 5.66% 仅升至 26.84%）

评分¶

新颖性: ⭐⭐⭐⭐ 首次系统研究 LVLM 版权合规是新颖的，但 CopyGuard 框架的技术创新性一般（工具组合）
实验充分度: ⭐⭐⭐⭐⭐ 12 个模型 + 50K 数据集 + 4 种侵权场景 + 5 种版权声明 + 标准 benchmark 无害验证，非常全面
写作质量: ⭐⭐⭐⭐ 问题定义清晰，研究设计严谨，附录非常详细
价值: ⭐⭐⭐⭐⭐ 版权合规是 AI 部署的法律刚需，benchmark 和 CopyGuard 有直接实用价值