G-reasoner: Foundation Models for Unified Reasoning over Graph-structured Knowledge¶
会议: ICLR 2026
arXiv: 2509.24276
代码: 项目页面
领域: 自监督学习 / 图基础模型 / RAG
关键词: graph foundation model, RAG, knowledge graph, GNN, LLM reasoning
一句话总结¶
提出 G-reasoner,通过 QuadGraph 四层统一图接口将异构知识源标准化,训练 34M 参数的 GNN 图基础模型联合推理图拓扑和文本语义,配合 LLM 在 6 个基准上全面超越 SOTA GraphRAG 方法。
研究背景与动机¶
- 领域现状:LLM 擅长推理但受限于静态参数知识,RAG 通过外部知识增强 LLM。图可以自然建模知识间关系(知识图谱、文档图、层次图等),GraphRAG 试图结合两者。
- 现有痛点:现有 GraphRAG 方法依赖特定图结构设计(知识图谱/文档图/层次图各不相同)、启发式搜索(PageRank)或昂贵的 Agent 管道(多次调用 LLM),泛化性差且效率低。
- 核心矛盾:不同知识源需要不同图结构,但没有统一框架能适配各种图结构并高效推理。
- 本文要解决什么? 设计统一的图表示和推理框架,适配多种知识图结构、高效且可泛化。
- 切入角度:定义四层标准化图结构 QuadGraph,用 GNN 图基础模型做统一推理。
- 核心idea一句话:将异构图统一为 QuadGraph(属性层+知识图谱层+文档层+社区层),训练 GFM 联合推理拓扑和语义,增强 LLM。
方法详解¶
整体框架¶
(1) QuadGraph 将各种图结构统一为 4 层标准格式;(2) 34M 参数的 GNN 基础模型在 QuadGraph 上推理;(3) 推理结果输入 LLM 生成最终答案。
关键设计¶
- QuadGraph 统一图接口:
- 做什么:标准化异构知识源
- 四层结构:属性层(节点公共属性)→ 知识图谱层(实体+关系三元组)→ 文档层(非结构化文本)→ 社区层(语义/结构聚类的全局信息)
-
设计动机:知识图谱、文档图、层次图都可映射到这四层,消除了图结构依赖
-
GNN 图基础模型 (GFM):
- 做什么:联合推理图拓扑和文本语义
- 核心思路:使用查询依赖的 GNN(DistMult 消息函数),节点嵌入通过预训练文本编码器初始化,L 层消息传递后用类型特异的预测器对各类节点预测相关性
-
弱监督训练:用预训练文本编码器做"教师"提供伪标签,通过 KL 散度蒸馏到 GFM,缓解标注数据稀缺问题
-
分布式消息传递:
- 做什么:支持大规模训练和推理
- 核心思路:用 METIS 算法将图分区到多 GPU,每个设备存储子图,消息传递时先本地聚合再跨设备交换
- 混合精度训练:吞吐量提升 2.1 倍,GPU 内存减少 17.5%
损失函数 / 训练策略¶
标注节点的对数似然 + λ × 教师伪标签的 KL 蒸馏损失,大规模多数据集弱监督训练。
实验关键数据¶
主实验:多跳 QA + G-bench¶
| 方法 | HotpotQA F1 | MuSiQue F1 | 2Wiki F1 |
|---|---|---|---|
| BM25 | 63.4 | 28.8 | 51.2 |
| HippoRAG 2 | 71.1 | 49.3 | 69.7 |
| GFM-RAG | 69.5 | 49.2 | 77.7 |
| G-reasoner | 76.0 | 52.5 | 82.1 |
消融实验¶
| 配置 | 效果 |
|---|---|
| 无文本语义融合 | 显著下降,拓扑不够 |
| 无弱监督蒸馏 | 下降,标注数据不足 |
| 单一图类型训练 | 泛化差 |
| 完整 G-reasoner | 最佳 |
关键发现¶
- 在所有 6 个基准上全面 SOTA,包括多跳 QA 和 G-bench
- 比 Agent 方法(ToG, KAG)高效得多——单次前向传播 vs 多次 LLM 调用
- 跨图类型泛化能力强——在未见过的图结构上仍表现良好
亮点与洞察¶
- QuadGraph 的四层设计巧妙统一了知识图谱、文档图、层次图,有很好的抽象能力
- 弱监督蒸馏策略解决了图推理中标注稀缺的实际问题
- 34M 参数的高效 GFM 相比 Agent 方法大幅降低推理成本
局限性 / 可改进方向¶
- QuadGraph 的四层结构是否覆盖所有知识类型?时序知识、多模态知识可能需要扩展
- GFM 依赖预训练文本编码器的质量
- 仅验证了文本领域,多模态推理待探索
相关工作与启发¶
- vs GFM-RAG: 前身工作,仅限知识图谱,G-reasoner 扩展到任意图结构
- vs GraphRAG (MS): 依赖特定层次图+LLM 摘要,泛化差
- vs HippoRAG: 用 PageRank 搜索,未充分利用基础模型能力
评分¶
- 新颖性: ⭐⭐⭐⭐ QuadGraph 统一接口 + GFM 联合推理是有意义的系统贡献
- 实验充分度: ⭐⭐⭐⭐⭐ 6 个基准、消融、效率分析、泛化测试全面
- 写作质量: ⭐⭐⭐⭐ 框架清晰,图示好
- 价值: ⭐⭐⭐⭐ 为 GraphRAG 提供可扩展的统一解决方案