Knowledge Graph Retrieval-Augmented Generation for LLM-based Recommendation¶

会议: ACL 2025
arXiv: 2501.02226
代码: 无
领域: 文本生成
关键词: 知识图谱, RAG, 推荐系统, 结构化知识, LLM推荐

一句话总结¶

提出 K-RagRec 框架，将知识图谱（KG）中的结构化关系信息引入 LLM 推荐系统的 RAG 流程——从 KG 中检索高质量的结构化实体关系信息来增强推荐生成，解决纯文本 RAG 忽略结构关系和引入噪声的问题。

研究背景与动机¶

领域现状：LLM 被用于下一代推荐系统，但面临幻觉和缺乏最新/领域知识的问题。RAG 通过检索外部知识来缓解，但传统 RAG 以纯文本形式检索，忽略了知识的结构化关系。
现有痛点：(a) 纯文本 RAG 引入噪声——检索到的段落可能包含无关信息；(b) 忽略了实体之间的结构关系——推荐需要理解"用户-物品-属性"的图结构因果关系，纯文本难以表达。
核心矛盾：知识图谱有丰富的结构信息但 LLM 不能直接处理图结构；文本化 KG 信息又失去了结构优势。
本文要解决什么？ 如何高效地从 KG 中检索结构化信息并转化为 LLM 可理解的格式来增强推荐。
切入角度：设计 KG-aware 的检索策略——从 KG 中提取与用户/物品相关的子图，线性化为文本后作为 RAG 的上下文。
核心idea一句话：用知识图谱的结构化信息替代纯文本做 RAG，为 LLM 推荐提供更高质量的外部知识。

方法详解¶

整体框架¶

K-RagRec 包含三个组件：(1) KG 子图检索——根据用户交互历史在 KG 中定位相关实体和关系子图；(2) 子图编码与线性化——将检索到的子图转化为 LLM 可理解的文本序列；(3) RAG 增强推荐生成——将线性化的 KG 信息作为上下文提供给 LLM 进行推荐生成。

关键设计¶

KG 子图检索:
做什么：为每个推荐请求从 KG 中检索相关子图
核心思路：以用户交互过的物品为锚点，在 KG 中沿边扩展 k 跳，收集相关实体和关系。用注意力机制对边进行加权，保留最信息量的路径
设计动机：全 KG 太大无法直接使用，需要针对性提取
结构信息线性化:
做什么：将图结构转化为 LLM 可读的文本
核心思路：将三元组 (head, relation, tail) 转化为自然语言描述，如 "iPhone 14 属于智能手机类别，具有 A15芯片特征"
设计动机：保留结构语义的同时适应 LLM 的文本输入格式
融合推荐生成:
做什么：将 KG 信息与用户历史结合生成推荐
核心思路：将线性化的 KG 信息和用户交互历史拼接为提示，让 LLM 生成推荐理由和物品列表
设计动机：KG 提供了"物品为什么适合用户"的推理依据

损失函数 / 训练策略¶

使用 SFT 微调 LLM 以适应推荐任务格式
KG 来源：多个公开推荐数据集的配套知识图谱

实验关键数据¶

主实验¶

方法	推荐准确率	说明
LLM only (零样本)	基线	缺乏领域知识
LLM + 文本 RAG	中	检索文本信息
K-RagRec (KG RAG)	最高	KG 结构信息更有效

消融实验¶

配置	效果	说明
w/o KG 子图 (纯文本RAG)	性能下降	结构信息重要
w/o 注意力加权	略微下降	子图剪枝有用
不同 KG 跳数(1/2/3跳)	2跳最佳	1跳信息不足，3跳噪声增加

关键发现¶

KG 结构信息比纯文本描述更有利于推荐——因为它提供了明确的"物品-属性-类别"关系
2跳子图在信息量和噪声之间取得最佳平衡
线性化方式对效果有影响——自然语言描述优于简单三元组拼接
在冷启动场景下改进最大——KG 提供了用户历史无法覆盖的信息

亮点与洞察¶

"用结构替代文本做RAG"的思路在推荐场景特别适用——推荐本质上是关系推理，图结构天然对应。
KG 作为外部知识源比纯文本文档更高质量——结构化、去噪、关系明确。
冷启动场景的大幅改进说明 KG 的知识补充价值。
该方法可迁移到其他需要结构化推理的 RAG 场景（如医疗诊断、法律推理）。

局限性 / 可改进方向¶

KG 的构建和维护成本高——需要人工或半自动方式创建
线性化可能丢失部分图结构信息
仅在推荐任务上验证
大规模 KG 的子图检索效率需优化

评分¶

新颖性: ⭐⭐⭐⭐ KG+RAG+推荐的有效组合
实验充分度: ⭐⭐⭐⭐ 多数据集+消融+冷启动分析
写作质量: ⭐⭐⭐⭐ 问题定义清晰
价值: ⭐⭐⭐⭐ 对LLM推荐系统有实用价值