🕸️ 图学习¶
🧠 NeurIPS2025 · 共 27 篇
- BLISS: Bandit Layer Importance Sampling Strategy for Efficient Training of Graph Neural Networks
-
提出 BLISS,将 GNN 的层级邻居采样建模为多臂老虎机问题,用 EXP3 算法动态调整每条边的采样概率,根据邻居对节点表示的方差贡献作为奖励信号,在 GCN 和 GAT 上维持或超越全批次训练精度。
- Deliberation on Priors: Trustworthy Reasoning of LLMs on Knowledge Graphs
-
提出 Deliberation over Priors(DP)框架,通过渐进式知识蒸馏(SFT + KTO 偏好优化)提升关系路径生成的忠实度,并通过约束引导的内省-回溯机制保障推理可靠性,在 ComplexWebQuestions 上 H@1 提升 16.5%,且 LLM 调用次数仅为 2.9 次(ToG 需 22.6 次)。
- Diagnosing and Addressing Pitfalls in KG-RAG Datasets: Toward More Reliable Benchmarking
-
系统审计16个KGQA数据集发现平均事实正确率仅57%(WebQSP 52%,MetaQA 20%),提出KGQAGen框架——通过LLM引导的子图扩展+SPARQL自动验证构建高质量多跳QA数据集KGQAGen-10k(96.3%准确率),揭示KG-RAG的主要瓶颈在检索而非推理。
- Disentangling Hyperedges through the Lens of Category Theory
-
首次从范畴论视角分析超边解耦,基于自然性条件导出"因子表示一致性"标准(聚合后解耦 vs 解耦后聚合应一致),提出 Natural-HNN 模型在6个癌症分型数据集上全面超越14个baseline(BRCA F1 从75.7%提升至80.4%),并能100%正确捕获基因通路的功能上下文。
- DuetGraph: Coarse-to-Fine Knowledge Graph Reasoning with Dual-Pathway Global-Local Fusion
-
DuetGraph 提出双通路(消息传递 + 全局注意力)并行融合模型与粗到精推理优化策略,通过分离而非堆叠局部/全局信息处理来缓解 KG 推理中的分数过平滑问题,在归纳与传导推理任务上取得 SOTA,MRR 最高提升 8.7%、训练加速 1.8×。
- Dynamic Bundling with Large Language Models for Zero-Shot Inference on Text-Attributed Graphs
-
DENSE 提出"文本捆绑"策略,将拓扑/语义相近的节点文本打包后查询 LLM 获取 bundle 级别标签,再用 entropy-based 和 ranking-based 损失监督 GNN 训练,并动态精炼 bundle 排除噪声节点,在 10 个 TAG 数据集上零样本推理全面超越 GPT-4o 和图基础模型。
- Elastic Weight Consolidation for Knowledge Graph Continual Learning: An Empirical Evaluation
-
本文在 FB15k-237 上系统评估了弹性权重固化(EWC)对 TransE 知识图谱嵌入持续学习的效果,发现 EWC 将灾难性遗忘从 12.62% 降至 6.85%(减少 45.7%),并揭示了任务划分策略(基于关系 vs 随机)对遗忘度量的显著影响(9.8 个百分点差异)。
- FALCON: An ML Framework for Fully Automated Layout-Constrained Analog Circuit Design
-
FALCON 提出端到端的模拟/RF 电路自动化设计框架,通过 MLP 拓扑选择 + 边中心 GNN 性能预测 + 可微版图约束梯度推理三阶段流水线,在 100 万级 Cadence 仿真数据集上实现 >99% 拓扑选择准确率、<10% 性能预测误差,单实例推理不到 1 秒。
- From Sequence to Structure: Uncovering Substructure Reasoning in Transformers
-
本文通过实证和理论分析揭示 decoder-only Transformer 如何从文本序列中理解图结构,提出"诱导子图过滤"(ISF)解释子结构逐层识别机制,并扩展到 LLM 验证一致性、复合图推理(Thinking-in-Substructures)和属性图(分子图)子结构提取。
- GFM-RAG: Graph Foundation Model for Retrieval Augmented Generation
-
提出首个图基础模型驱动的检索增强生成框架 GFM-RAG,通过 query-dependent GNN 在知识图谱上进行单步多跳推理,仅 8M 参数即可在未见数据集上零样本泛化,在多跳QA检索任务上大幅超越 SOTA。
- Graph Persistence goes Spectral
-
提出 SpectRe——将图拉普拉斯谱信息融入持续同调(PH)图的新拓扑描述符,证明其表达力严格强于 PH 和谱信息单独使用,建立了局部稳定性理论,在合成和真实数据集上提升 GNN 的图分类能力。
- Graphfaas Serverless Gnn Inference For Burst-Resilient Real-Time Intrusion Detec
-
提出GraphFaaS,基于Serverless的GNN推理架构用于突发负载下的实时入侵检测:时间局部性图构建+频率过滤+贪心图分区实现延迟降低85%、变异系数降低64%同时保持准确率。
- GraphTOP: Graph Topology-Oriented Prompting for Graph Neural Networks
-
提出首个图拓扑导向的 prompting 框架 GraphTOP,通过将 topology-oriented prompting 建模为边重连问题并用 Gumbel-Softmax 松弛到连续空间,在 5 个数据集 4 种预训练策略下超越 6 个基线方法。
- Making Classic GNNs Strong Baselines Across Varying Homophily: A Smoothness-Generalization Perspective
-
从理论上揭示了 GNN 消息传递中平滑性(smoothness)与泛化性(generalization)之间的两难困境,提出 IGNN 框架通过三个简约设计原则(分离邻域变换、感知聚合、邻域关系学习)缓解该困境,在 30 个基线中表现最优且具备跨同质/异质图的通用性。
- Moscat: Mixture of Scope Experts at Test for Generalizing Deeper GNNs
-
通过 PAC-Bayes 界证明 GNN 深度变化导致不同同质性子群间的泛化偏好漂移,提出 Moscat——后处理注意力门控模型,在测试时自适应组合不同深度的独立训练 GNN 专家。
- Nonlinear Laplacians: Tunable Principal Component Analysis under Directional Prior Information
-
提出非线性Laplacian谱算法,通过在观测矩阵 \(\bm{Y}\) 上添加由度数向量经非线性函数 \(\sigma\) 变换后得到的对角矩阵,将谱信息与方向先验信息融合,在稀疏偏向PCA问题中显著降低信号检测阈值(从 \(\beta^*=1\) 降至约 \(0.76\))。
- OCN: Effectively Utilizing Higher-Order Common Neighbors for Better Link Prediction
-
揭示高阶公共邻居(CN)在链接预测中的冗余和过平滑问题,提出正交化(Gram-Schmidt 去除阶间线性相关)+ 归一化(除以路径数,广义资源分配启发式)解决方案,在 7 个数据集上平均提升 HR@100 7.7%,DDI 数据集上提升 13.3%。
- Over-squashing in Spatiotemporal Graph Neural Networks
-
首次形式化时空图神经网络(STGNN)中的 over-squashing 问题,揭示了因果卷积中反直觉的"时间远处偏好"现象(最早时间步对最终表示影响最大),并证明 time-and-space 和 time-then-space 架构在信息瓶颈上等价,为使用计算高效的 TTS 架构提供理论支持。
- PKD: Preference-driven Knowledge Distillation for Few-shot Node Classification
-
PKD 框架协同 LLM 和多 GNN 教师做文本属性图少样本节点分类——GNN 偏好节点选择器(GNS)用 KL 散度不确定性选择需要 LLM 标注的节点,节点偏好 GNN 选择器(NGS)用 RL 为每个节点匹配最优 GNN 教师,在 9 个数据集上一致 SOTA(Cornell 87% vs 基线 59-82%)。
- Relieving the Over-Aggregating Effect in Graph Transformers
-
发现了 Graph Transformer 中的 over-aggregating 现象——大量节点以近均匀注意力分数被聚合导致关键信息被稀释,提出 Wideformer 通过分割聚合+引导注意力来缓解,作为即插即用模块在 13 个数据集上一致提升骨干模型性能。
- S'MoRE: Structural Mixture of Residual Experts for Parameter-Efficient LLM Fine-tuning
-
提出S'MoRE框架,将低秩残差专家组织成多层树状结构,通过层次化路由为每个token构建定制化的"残差树",在与LoRA相当的参数量下实现指数级增长的结构灵活性,显著提升LLM微调效果。
- TAMI: Taming Heterogeneity in Temporal Interactions for Temporal Graph Link Prediction
-
首次系统识别时序图交互中的异质性问题(交互间隔呈幂律分布),提出TAMI框架包含对数时间编码(LTE)和链接历史聚合(LHA)两个模块,可无缝集成到现有TGNN中,在16个数据集上持续提升链接预测性能,最高提升87.05%。
- The Underappreciated Power of Vision Models for Graph Structural Understanding
-
揭示视觉模型(ResNet/ViT/Swin等)在图结构理解方面被严重低估的能力——通过将图渲染为图像并用视觉编码器处理,在全局拓扑感知和跨尺度泛化上显著优于GNN,并提出GraphAbstract benchmark系统评估这一发现。
- Uniedit A Unified Knowledge Editing Benchmark For Large Language Models
-
构建UniEdit——基于25个开放域知识的统一LLM知识编辑基准,提出邻域多跳链采样(NMCS)算法评估编辑的波纹效应。
- Unifying Text Semantics and Graph Structures for Temporal Text-attributed Graphs with LLMs
-
提出 Cross 框架——用 LLM 在策略采样的时间点上动态总结节点邻域的语义演变(Temporal Reasoning Chain),然后通过语义-结构协同编码器双向融合文本语义和图结构时序信息,在时序链接预测上平均 MRR 提升 24.7%,工业数据(微信)上 AUC 提升 3.7%。
- What Expressivity Theory Misses: Message Passing Complexity for GNNs
-
批判 GNN 的二值表达力理论无法解释实际性能差异,提出 MPC——基于概率性 lossyWL 的连续、任务特定复杂度度量,与准确率的 Spearman 相关性达 -1(传统 WLC 恒为零),成功解释了 GCN+虚拟节点为何在长程任务上优于更高表达力的高阶模型。
- When No Paths Lead to Rome: Benchmarking Systematic Neural Relational Reasoning
-
提出NoRA benchmark,系统性地打破现有关系推理benchmark中"推理可归约为路径组合"的假设,引入非路径推理、歧义事实和多关系等挑战,揭示包括o3在内的所有现有模型在off-path推理上的根本缺陷。