CausalRAG: Integrating Causal Graphs into Retrieval-Augmented Generation¶
会议: ACL 2025
arXiv: 2503.19878
代码: https://github.com/Pwnb/CausalRAG (有)
领域: RAG / 因果推理
关键词: 检索增强生成, 因果图, 知识图谱, 文档问答, 图索引
一句话总结¶
提出 CausalRAG,将因果图集成到 RAG 的检索过程中——从文档构建文本图并识别因果关系,在查询时通过因果路径发现和因果摘要生成来检索上下文,在文档问答中显著提升上下文精度(92.86%)和检索召回率。
研究背景与动机¶
- 领域现状:RAG 通过检索外部知识来增强 LLM 的事实性。标准 RAG 基于文本分块+语义相似度检索,GraphRAG 则构建知识图谱辅助检索。
- 现有痛点:(1) 标准 RAG 的文本分块会破坏文档结构和因果链;(2) 语义相似度不等于因果相关性——相似词不意味着因果关系;(3) GraphRAG 在检索精度和召回率之间存在 tradeoff(Local 精度高但召回低,Global 反之)。
- 核心矛盾:很多复杂问题需要沿因果链推理(A 导致 B 导致 C),但语义相似度检索无法感知这种链式关系。
- 本文要解决什么:如何让 RAG 系统理解并利用文档中的因果关系进行检索?
- 切入角度:在图索引阶段识别因果关系(用 LLM),在查询阶段发现相关因果路径,生成因果摘要作为检索上下文。
- 核心 idea:图索引 → 因果路径发现 → 因果摘要,三步实现因果感知的 RAG。
方法详解¶
整体框架¶
三个主要步骤:(1) 图索引:从文档中提取实体和关系,构建文本图,用 LLM 识别因果关系;(2) 因果路径发现:查询时找到与问题相关的因果路径;(3) 因果上下文检索:沿因果路径生成因果摘要,作为 LLM 的生成上下文。
关键设计¶
- 图索引与因果关系识别:
- 做什么:从文档构建包含因果关系标注的知识图谱
- 核心思路:用 LLM 提取实体和关系三元组,然后对每条关系用 LLM 判断是否为因果关系并标注方向
-
设计动机:因果关系是文档中最有价值的推理链路,显式标注使检索可以优先沿因果路径
-
因果路径发现:
- 做什么:给定用户查询,在因果图中找到相关的因果路径
- 核心思路:从查询实体出发,沿因果边扩展 k 跳,收集 s 个候选路径,用 LLM 选择最相关的因果路径
-
设计动机:因果路径比孤立的三元组提供更完整的推理链,k 和 s 控制检索的深度和广度
-
因果上下文检索与摘要:
- 做什么:将因果路径转化为自然语言摘要,作为 LLM 的生成上下文
- 核心思路:LLM 根据选中的因果路径生成结构化的因果摘要,保留因果链条的逻辑关系
- 设计动机:相比直接拼接检索文本块,因果摘要更聚焦、更有逻辑性
损失函数 / 训练策略¶
- 无需训练——完全基于 LLM 的 in-context 能力做图构建、因果识别、路径选择和摘要生成
- 超参数 k(因果路径跳数)和 s(候选路径数)需要调优,最佳 k=3, s=3
实验关键数据¶
主实验(基于 OpenAlex 学术论文的 QA)¶
| 方法 | Answer Faithfulness↑ | Context Precision↑ | Context Recall↑ |
|---|---|---|---|
| GraphRAG-Local | 78.18 | 89.18 | 41.54 |
| GraphRAG-Global | 55.27 | 66.67 | 47.22 |
| HippoRAG2 | 67.36 | 73.72 | 47.22 |
| CausalRAG | 78.00 | 92.86 | 49.46 |
消融实验(k 和 s 参数研究)¶
| k, s | 综合性能 |
|---|---|
| k=1, s=1 | 0.534 |
| k=3, s=3 | 0.782 |
| k=5, s=5 | 0.824 |
关键发现¶
- 因果路径检索在精度和召回上同时优于 GraphRAG: Context Precision 92.86(+3.68 vs GraphRAG-Local),Context Recall 49.46(+7.92 vs GraphRAG-Local)
- 文档越长,CausalRAG 优势越大:从摘要(72.43)到全文(91.69),CausalRAG 在长文档上提升更显著
- 因果推理减少幻觉:Answer Faithfulness 78.00,接近最佳的 GraphRAG-Local 78.18,但 precision 更高
亮点与洞察¶
- "因果关系 > 语义相似度"用于检索:这是核心洞察。很多 RAG 失败案例是因为检索到语义相关但因果无关的内容,CausalRAG 通过因果路径有效解决了这个问题
- 无需训练的即插即用方案:完全基于 LLM 能力,不需要额外训练,易于部署
- k 和 s 的渐进分析:提供了检索深度/广度与性能的清晰 tradeoff 指导
局限性 / 可改进方向¶
- 依赖 LLM 内部知识做因果识别,在专业领域(医学/法律)可能不准确
- 因果路径识别需要额外 LLM 调用,引入计算开销
- 评估数据集规模较小(学术论文 QA),缺少大规模多领域验证
- 因果关系的识别质量直接影响下游性能,但缺少因果识别准确率的评估
相关工作与启发¶
- vs GraphRAG: GraphRAG 构建通用知识图谱,CausalRAG 专注因果子图,检索更有针对性
- vs HippoRAG2: HippoRAG2 模拟大脑记忆检索,CausalRAG 通过因果路径提供更结构化的推理
- vs 标准 RAG: 语义检索无法处理因果推理需求,CausalRAG 填补了这一空白
评分¶
- 新颖性: ⭐⭐⭐⭐ 因果图+RAG 的组合很有价值,但实现上主要依赖 LLM prompt
- 实验充分度: ⭐⭐⭐ 数据集小,评估指标有限
- 写作质量: ⭐⭐⭐⭐ 动机和方法阐述清晰
- 价值: ⭐⭐⭐⭐ 为 RAG 系统的因果感知检索提供了新方向