Beyond Simple Graphs: Neural Multi-Objective Routing on Multigraphs¶

会议: ICLR 2026
arXiv: 2506.22095
代码: https://github.com/filiprydin/GMS
领域: 组合优化 / 图神经网络 / 车辆路径规划
关键词: 多目标路由, 多重图, 图神经网络, 自回归构造, Pareto优化

一句话总结¶

首次提出针对多重图（multigraph）的神经组合优化路由方法 GMS，包含直接在多重图上边级自回归构造的 GMS-EB 和先学习剪枝再节点级路由的双头 GMS-DH 两个变体，在非对称多目标 TSP 和 CVRP 上实现了接近精确求解器 LKH 的性能且速度快数十倍。

研究背景与动机¶

领域现状：近年来，基于深度学习的组合优化求解器在车辆路径问题（VRP）上取得了显著进展，已有方法（Kool et al., POMO, MatNet 等）在 TSP 和 CVRP 上逼近甚至超越经典启发式。然而，所有现有神经求解器都假设问题定义在简单图上——即每对节点之间最多只有一条边。
现有痛点：现实世界中，多重图（multigraph）表示更加准确——同一对节点间可能有多条不同属性的边（如不同路径的行驶时间和距离不同）。运筹学研究已证明多重图建模可带来 5-10% 的成本优化，但现有神经方法无法处理多重图，原因有二：(i) Transformer 编码器不适合编码多重图结构；(ii) 解码策略需要同时选择节点顺序和边，现有方法只选节点。
核心矛盾：多重图上的路由问题比简单图复杂得多——不仅要决定访问节点的顺序，还要在每对节点间选择哪条边。在多目标设置下，不同边在不同目标上各有优劣，无法先验地确定最优边选择。
本文要解决什么？ 如何设计能处理多重图输入的神经路由求解器，同时支持多目标优化？
切入角度：作者提出两种互补策略——(1) 直接在多重图上做边级自回归构造；(2) 先用学习的剪枝策略将多重图简化为简单图，再做节点级路由。两者都使用图边注意力网络（GREAT）处理多重图结构。
核心idea一句话：用GNN编码多重图边嵌入，通过边级自回归或"非自回归剪枝+自回归路由"的双头解码实现多目标多重图路由。

方法详解¶

整体框架¶

输入是一个有向多重图 \(G\)，每对节点间有 \(M\) 条边、每条边有多维费用向量。目标是找到 Pareto 前沿——即对多个目标都不被支配的路径集合。通过 Chebyshev 标量化将多目标问题分解为多个子问题，每个子问题对应一个偏好向量 \(\lambda\)。两个 GMS 变体共享基于 GREAT 的编码器，但解码策略不同。

关键设计¶

GREAT 编码器（Graph Edge Attention Network）：
做什么：将多重图编码为边嵌入，保留平行边的区分能力
核心思路：每层由注意力子层组成，先通过注意力分数 \(\alpha'\), \(\alpha''\) 对入边和出边嵌入分别加权聚合得到临时节点表示 \(x_i = (\sum_{l \in E^+(i)} \alpha'_{il} W'_1 e_l \| \sum_{l' \in E^-(i)} \alpha''_{il'} W''_1 e_{l'})\)，再用首尾节点拼接更新边嵌入 \(e'_l = W_2(x_{\text{start}(l)} \| x_{\text{end}(l)})\)。残差连接确保平行边保持不同的嵌入
设计动机：标准 Transformer 无法区分同一对节点间的多条边，GREAT 直接在边上操作并通过残差保留边的个性化信息
GMS-EB（边级自回归构造）：
做什么：直接在多重图上预测下一条要经过的边（而非节点）
核心思路：编码器输出边嵌入后，边级 Multi-Pointer 解码器在每步选择下一条边 \(\pi_t\)，概率为 \(p_{\theta(\lambda)}(\pi_t | \pi_{1:t-1}, s)\)。偏好 \(\lambda\) 通过 MLP 超网络生成解码器权重 \(\theta_{\text{dec}}(\lambda) = \text{MLP}(\lambda)\)，编码器与偏好无关
设计动机：边级解码简单直接，端到端学习边选择和节点顺序。但内存复杂度为 \(\mathcal{O}(MN^4)\)（vs 节点级 \(\mathcal{O}(N^3)\)），限制了可扩展性
GMS-DH（双头解码）：
做什么：先用选择解码器学习剪枝多重图为简单图，再用路由解码器构造路径
核心思路：第一阶段（非自回归剪枝）——选择解码器在中间 GREAT 层后对每对节点独立选择保留一条边，概率 \(q_{\tilde{\theta}(\lambda)}(l | i, j, s)\)。第二阶段（自回归路由）——剪枝后的边嵌入聚合为节点嵌入，经过额外 Transformer 层，然后用偏好条件化的 Multi-Pointer 解码器做节点级路由。两个阶段的权重都由 MLP 超网络生成
设计动机：将问题分解为"选边"和"排路线"两个子任务，节点级解码器复杂度更低。编码器主体对偏好无关，只需运行一次，多个偏好共享编码，大幅提升推理效率

训练策略¶

多目标 REINFORCE：GMS-EB 使用标准 POMO 框架，奖励为负 Chebyshev 标量化代价 \(R_\lambda(\pi) = -\max_i\{\lambda_i|f_i(\pi) - z_i^*|\}\)
GMS-DH 双头训练：选择头和路由头分别有独立的奖励和基线。路由头奖励为 \(R^{(2)}_\lambda(\pi) = R_\lambda(\pi)\)；选择头奖励用路由头的 \(K_2\) 个采样近似最优路径 \(R^{(1)}_\lambda(\mathcal{E}) \approx \max_{k=1,...,K_2} R_\lambda(\pi_k)\)
课程学习（Curriculum Learning）：从小图开始训练，逐步增大问题规模。GMS-DH 先在简单图上预训练路由头，确保选择头训练初期近似准确

实验关键数据¶

主实验¶

在 MOTSP、MOCVRP（简单图）和 MGMOTSP、MGMOCVRP（多重图）上评估，使用 TMAT/XASY（简单图）和 FLEX/FIX（多重图）分布，规模 50/100 节点，指标为归一化超体积（HV）。

问题	方法	HV (50节点)	Gap	HV (100节点)	Gap	推理时间
MOTSP-TMAT	LKH (精确)	0.58	0.00%	0.63	0.00%	6-29m
MOTSP-TMAT	MBM (aug)	0.52	10.2%	0.58	9.17%	27s-2.4m
MOTSP-TMAT	GMS-EB (aug)	0.57	1.14%	0.63	1.13%	3.3m-29m
MOTSP-TMAT	GMS-DH (aug)	0.57	1.76%	0.62	2.19%	28s-2.6m
MOCVRP-XASY	GMS-EB (aug)	0.75	0.00%	0.80	0.00%	4.9m-48m
MGMOTSP-FLEX2	GMS-EB (aug)	0.89	1.50%	0.93	1.47%	7.5m-1.2h
MGMOTSP-FLEX2	GMS-DH (aug)	0.89	1.45%	0.93	1.61%	1.5m-6.6m
MGMOTSP-FLEX2	GMS-DH PP	0.77	14.24%	0.83	12.53%	33s-2.3m

消融实验¶

配置	MGMOTSP HV (50)	说明
GMS-DH (完整)	0.89 (FLEX2)	学习边选择+路由
GMS-DH PP (预剪枝)	0.77 (FLEX2)	先按线性标量化剪枝，HV 下降 14%
GMS-DH Simple (简单剪枝)	0.83 (FLEX2 MGMOTSPTW)	用简单函数替代选择头，下降 7%
MBM (预剪枝)	0.86-0.87 (FLEX2)	MatNet+预剪枝，性能不稳定

零样本泛化（200节点，训练时只见≤100）¶

问题	方法	HV (200节点)	Gap
MOTSP-TMAT	LKH	0.67	0.00%
MOTSP-TMAT	GMS-EB	0.66	1.86%
MOTSP-TMAT	GMS-DH	0.65	3.59%
MGMOTSP-FLEX2	GMS-EB	0.95	1.74%
MGMOTSP-FLEX2	GMS-DH	0.95	2.27%

关键发现¶

GMS-EB 在所有问题上性能最优（接近LKH），但内存和时间开销更大
GMS-DH 性能略低但推理速度快 5-10 倍，更适合大规模应用
预剪枝（GMS-DH PP）性能严重下降（10-15%），说明显式建模多重图结构至关重要
在 MGMOTSPTW（带时间窗的复杂问题）上，GMS-EB/DH 大幅超越所有基线，学习边选择 vs 简单剪枝的优势更加明显
MOEA（进化算法）在所有设置下都显著弱于神经方法，尤其在100节点规模
零样本泛化到200节点时性能下降很小（HV gap < 4%）

亮点与洞察¶

NAR剪枝+AR路由的双头设计非常巧妙：将多重图问题分解为两个互补任务，选择头只需运行一次（非自回归），路由头在简化后的简单图上高效运行。这种结构设计同时解决了表达能力和计算效率的矛盾
编码器偏好无关的设计：GREAT 编码器不依赖偏好 \(\lambda\)，同一实例只需编码一次即可服务所有偏好的推理。MLP 超网络只调制解码器权重，极大减少了多偏好推理的计算量
预剪枝失败的反直觉发现：即使对 MOTSP 有理论保证线性标量化下预剪枝不损失最优（Proposition 1），实际用预剪枝+GMS-DH 的性能仍严重下降。作者猜测预剪枝改变了数据分布，使模型难以建模

局限性 / 可改进方向¶

GMS-EB 的 \(\mathcal{O}(MN^4)\) 复杂度限制了对大规模问题的应用，作者本身也提到需要更可扩展的方案
实验中多重图最多只考虑了每对节点2条边（FLEX2/FIX2），更多平行边的场景未测试
只在双目标问题上做了主实验，三目标放在附录，更高维目标的扩展性未充分验证
训练需要大量随机生成实例（200 epoch × 100K 实例），训练成本较高
课程学习策略（先小图后大图）可能对不同问题分布的效果不一致

评分¶

新颖性: ⭐⭐⭐⭐ 首次将神经组合优化扩展到多重图，边级自回归和双头解码都是新设计
实验充分度: ⭐⭐⭐⭐⭐ 多问题（TSP/CVRP/TSPTW）、多分布（TMAT/XASY/FLEX/FIX）、多规模（50/100/200），消融和泛化全面
写作质量: ⭐⭐⭐⭐ 结构清晰，Proposition 1 的理论分析为方法设计提供了动机
价值: ⭐⭐⭐⭐ 填补了神经路由在多重图上的空白，对物流/交通领域有实用价值