Copy-Paste to Mitigate Large Language Model Hallucinations¶

vs Context-DPO: 同为 DPO 方法，但 Context-DPO 不强调复制偏好，本文显式优化复制
vs Attributed LLM: 仅标注引用来源但不改变生成方式，本文从生成方式本身入手

会议: ICLR 2026
arXiv: 2510.00508
代码: https://github.com/longyongchao/CopyPasteLLM (有)
领域: LLM NLP / 文本生成 / RAG
关键词: 幻觉缓解, RAG, 复制粘贴, DPO, 忠实性

一句话总结¶

提出 Copy-Paste 生成范式，通过训练 LLM 优先直接复制检索上下文中的片段来生成回答，而非自由改写，配合高复制偏好的 DPO 训练，在反事实 RAG 基准上将忠实度从 80.2% 提升到 92.8%。

领域现状：RAG（检索增强生成）通过为 LLM 提供外部上下文来减少幻觉，但 LLM 在生成回答时经常"改写"而非直接引用上下文，导致信息扭曲和幻觉。
现有痛点：LLM 的改写过程引入两类幻觉——"Twist"（扭曲上下文中的事实）和"Causal"（因果链上游错误传播到下游）。引用标注方法只标记来源但不改变生成方式。
核心矛盾：高度流畅的改写和高度忠实的复制之间存在权衡——改写虽然读起来流畅，但每一次改写都是幻觉的风险点。
本文要解决什么？ 能否让 LLM 在保持可读性的同时，尽可能直接复制上下文片段？
切入角度：从注意力锚定角度分析——如果上一个生成 token 是从上下文复制的，那么下一个 token 的查询向量与上下文键向量强相关，自然倾向于继续复制。
核心idea一句话：训练 LLM 建立"高复制偏好"——通过 DPO 让模型偏好直接嵌入上下文片段的回答风格。

两阶段：(1) Copy-Paste-Prompting 生成高复制率的候选回答（CP-Order/CP-Link/CP-Refine 三种策略），(2) 多维度筛选 + Elo 排序 + DPO 训练。