G-reasoner: Foundation Models for Unified Reasoning over Graph-structured Knowledge¶

vs GFM-RAG: 前身工作，仅限知识图谱，G-reasoner 扩展到任意图结构
vs GraphRAG (MS): 依赖特定层次图+LLM 摘要，泛化差
vs HippoRAG: 用 PageRank 搜索，未充分利用基础模型能力

会议: ICLR 2026
arXiv: 2509.24276
代码: 项目页面
领域: 自监督学习 / 图基础模型 / RAG
关键词: graph foundation model, RAG, knowledge graph, GNN, LLM reasoning

一句话总结¶

提出 G-reasoner，通过 QuadGraph 四层统一图接口将异构知识源标准化，训练 34M 参数的 GNN 图基础模型联合推理图拓扑和文本语义，配合 LLM 在 6 个基准上全面超越 SOTA GraphRAG 方法。

领域现状：LLM 擅长推理但受限于静态参数知识，RAG 通过外部知识增强 LLM。图可以自然建模知识间关系（知识图谱、文档图、层次图等），GraphRAG 试图结合两者。
现有痛点：现有 GraphRAG 方法依赖特定图结构设计（知识图谱/文档图/层次图各不相同）、启发式搜索（PageRank）或昂贵的 Agent 管道（多次调用 LLM），泛化性差且效率低。
核心矛盾：不同知识源需要不同图结构，但没有统一框架能适配各种图结构并高效推理。
本文要解决什么？ 设计统一的图表示和推理框架，适配多种知识图结构、高效且可泛化。
切入角度：定义四层标准化图结构 QuadGraph，用 GNN 图基础模型做统一推理。
核心idea一句话：将异构图统一为 QuadGraph（属性层+知识图谱层+文档层+社区层），训练 GFM 联合推理拓扑和语义，增强 LLM。

(1) QuadGraph 将各种图结构统一为 4 层标准格式；(2) 34M 参数的 GNN 基础模型在 QuadGraph 上推理；(3) 推理结果输入 LLM 生成最终答案。

标注节点的对数似然 + λ × 教师伪标签的 KL 蒸馏损失，大规模多数据集弱监督训练。

方法	HotpotQA F1	MuSiQue F1	2Wiki F1
BM25	63.4	28.8	51.2
HippoRAG 2	71.1	49.3	69.7
GFM-RAG	69.5	49.2	77.7
G-reasoner	76.0	52.5	82.1