SelfElicit: Your Language Model Secretly Knows Where is the Relevant Evidence¶

会议: ACL 2025
arXiv: 2502.08767
代码: https://github.com/ZhiningLiu1998/SelfElicit
领域: LLM NLP
关键词: 上下文增强, 注意力机制, 证据定位, RAG, 推理时方法

一句话总结¶

SelfElicit 发现 LLM 深层注意力分数天然能识别上下文中的关键证据（即使回答错误时也是），据此提出推理时自动高亮关键证据句的上下文增强方法，无需训练即可显著提升基于证据的 QA 任务性能。

输入(上下文+问题) → 第一次前向传播获取深层注意力分数 → 按句子聚合注意力 → 选 top-k 高注意力句子作为证据 → 在上下文中显式高亮这些句子（加标记） → 第二次前向传播生成最终答案。

深层注意力证据发现:
做什么：利用 LLM 深层 attention 分数自动识别上下文中的关键证据
核心思路：计算每层的头平均注意力 \(\mathbf{a}^{(\ell)} = \frac{1}{H}\sum_{h=1}^H \mathbf{a}^{(\ell,h)}\)，聚合到句子级别，深层（后 25%）注意力对证据句的相对注意力高达 6 倍
关键发现：即使模型回答错误，深层注意力也能正确指向证据——模型"知道"但没"用好"
显式证据高亮 (Explicit Highlighting):
做什么：在输入上下文中用特殊标记包裹关键证据句
核心思路：选择注意力最高的 top-k 句子，用 ** 等标记高亮，重新拼接上下文
设计动机：显式高亮帮助模型在第二次生成时更集中于关键信息
推理时增强特性:
无需训练、无需额外模型、无需迭代 prompting
仅增加约一次前向传播的计算开销
对超参数（高亮句子数 k、使用的层范围）鲁棒

任务	模型	基线	+SelfElicit	提升
HotpotQA	Llama3.1-8B	~45%	~55%	+10%
多种QA	多个模型	-	-	一致提升