CiteGuard: Faithful Citation Attribution for LLMs via Retrieval-Augmented Validation¶

会议: ACL 2026
arXiv: 2510.17853
代码: https://github.com/KathCYM/CiteGuard
领域: 科学引用验证
关键词: 引用归属, 检索增强验证, 科学写作, 幻觉缓解, Agent

一句话总结¶

CiteGuard 提出了一个检索增强的智能体框架，通过扩展的检索动作（包括全文搜索和上下文检索）为科学引用归属提供更忠实的基础，在 CiteME 基准上相对基线提升 10 个百分点，达到 68.1% 准确率，接近人类表现（69.2%）。

研究背景与动机¶

领域现状：LLM 越来越多地被用于科学写作辅助，但引用幻觉问题严重（LLM 可生成高达 78-90% 的虚构引用）。ICLR 2026 提交的 300 篇论文中发现了超过 50 个引用幻觉。

现有痛点：(1) LLM-as-a-Judge 在引用验证中召回率极低（仅 16-17%），因为 LLM 对术语的微小变化过于敏感；(2) CiteAgent 等现有方法的准确率仍远低于人类；(3) 现有方法缺乏对论文全文内容的搜索能力。

核心矛盾：仅基于标题和摘要的检索不足以确认引用关系，往往需要深入到论文全文进行交叉验证。

本文目标：设计一个更忠实、更泛化的引用归属 Agent。

切入角度：扩展检索动作集，特别是增加全文搜索和上下文检索能力。

核心 idea：引用验证需要超越标题/摘要级别的信息，通过全文搜索和上下文检索提供更强的证据基础。

方法详解¶

整体框架¶

CiteGuard 是一个基于 LLM 的 Agent，在 CiteAgent 的基础上扩展了三种新动作：find_in_text（论文全文搜索）、ask_for_more_context（源论文上下文检索）、search_text_snippet（跨论文全文片段搜索）。支持迭代检索推荐多个参考文献。

关键设计¶

扩展检索动作集:
- 功能：提供比标题/摘要更深层的证据
- 核心思路：新增 find_in_text（在特定论文全文中搜索查询）、ask_for_more_context（检索摘录上下文的前后 3 段）和 search_text_snippet（跨数据库的全文片段搜索）
- 设计动机：引用关系往往隐藏在论文正文中，仅看标题和摘要可能误判
迭代检索多引用推荐:
- 功能：推荐多个相关参考文献
- 核心思路：每次运行推荐一个参考，后续运行排除已选论文搜索新的参考。通过过滤已选集合 \(E_k\) 确保不重复推荐
- 设计动机：许多学术声明有多个有效引用，单一参考不足
跨领域泛化:
- 功能：评估方法在计算机科学以外领域的可用性
- 核心思路：收集 CiteMulti 扩展基准，覆盖生物医学、物理和数学领域，以及长段落场景
- 设计动机：验证方法的通用性

损失函数 / 训练策略¶

不涉及模型训练。Agent 使用 GPT-4o 或 DeepSeek-R1 作为基础模型。

实验关键数据¶

主实验¶

CiteME 基准结果

方法	所有难度准确率
CiteAgent + GPT-4o	35.4%
CiteGuard + GPT-4o	45.4% (+10pp)
CiteGuard + DeepSeek-R1	68.1%
人类表现	69.2%

消融实验¶

CiteGuard 能识别基准中未覆盖的替代有效引用
新增的检索动作（尤其是 find_in_text）对性能提升贡献最大
跨领域实验显示方法具有泛化潜力

关键发现¶

全文搜索能力对引用验证至关重要
接近人类表现的 68.1% 准确率证明了方法的有效性
LLM-as-a-Judge 在引用验证中不可靠，需要检索增强

亮点与洞察¶

解决了科学写作中的真实痛点，实用价值高
接近人类表现是重要里程碑
扩展的 CiteMulti 基准填补了跨领域评估的空白

局限与展望¶

依赖 Semantic Scholar API，可能不覆盖所有领域
全文搜索需要论文可访问，部分论文可能无法获取
迭代检索增加了推理成本
未来可探索将方法集成到学术写作工作流中

评分¶

新颖性: ⭐⭐⭐⭐ 全文搜索和迭代多引用推荐是实用创新
实验充分度: ⭐⭐⭐⭐ 跨领域评估 + 人工标注 + 多模型对比
写作质量: ⭐⭐⭐⭐ 问题定义清晰，实验设计合理