RaDAR: Relation-aware Diffusion-Asymmetric Graph Contrastive Learning for Recommendation¶

日期: 2026-03-17
arXiv: 2603.16800
代码: GitHub
领域: 推荐系统
关键词: 推荐系统, 扩散增强, 图对比学习, 关系感知去噪, 非对称对比学习

一句话总结¶

提出 RaDAR 框架，通过双视图生成（VGAE 全局结构 + 关系感知边去噪）与扩散增强的非对称对比学习，在 3 个二值边和 3 个加权边推荐基准上全面 SOTA，特别在高稀疏和高噪声条件下相比 AdaGCL 提升 3-5%。

研究背景与动机¶

领域现状: 协同过滤（CF）通过 GNN 在用户-物品二部图上建模高阶连通性。图对比学习（GCL）进一步通过多视图增强提升表示质量——SGL 用随机节点/边 dropout，SimGCL 用特征空间噪声，AdaGCL 引入可训练视图生成器。
现有痛点: (a) 结构语义退化：随机边扰动会破坏关键拓扑结构和协同信号，导致增强视图间语义不一致——例如删掉一条高频交互边，可能切断重要用户偏好路径；(b) 关系表达能力有限：现有方法假设同质性（homophily），只关注一跳邻居对齐，但真实用户交互常具异质性或远程同质性——例如两个兴趣相似的用户可能通过多跳路径连接而无直接交互。
核心矛盾: 增强视图需要同时满足两个矛盾目标：足够多样以提供有价值的对比信号，又不能破坏图的结构语义。随机扰动在多样性和语义保持之间无法平衡。
本文解决什么: 设计统一模型同时实现增强过程中的结构语义保持和多跳/异质邻域下的关系感知表达。
核心 idea 一句话: 用扩散模型做嵌入空间的渐进噪声注入-去噪实现鲁棒增强，用 VGAE + 关系感知边去噪模块做双视图生成，用非对称对比解耦节点身份与结构上下文。

方法详解¶

整体框架¶

RaDAR 包含四个组件，输入用户-物品交互二部图： 1. GNN 编码器：LightGCN 式多层消息传递 → 用户/物品嵌入 2. 双视图生成器：VGAE 生成全局视图 + 关系感知去噪生成局部视图 3. 扩散增强模块：对嵌入做正向噪声注入 + 反向学习去噪 4. 非对称对比优化：解耦身份表示和上下文表示，三阶段训练

关键设计¶

VGAE 全局视图生成器:
- 做什么：通过变分图自编码器捕获全局结构语义，生成重建图视图
- 核心思路：GCN 编码器产生节点嵌入后高斯采样 → 解码器重建图结构。优化 KL 散度正则、图重建判别损失、BPR 排序损失的联合目标
- 设计动机：VGAE 学到的潜在空间自然编码了全局连通性模式，生成的视图保持结构语义完整性——替代随机扰动
关系感知边去噪模块:
- 做什么：用自适应门控机制做逐层边掩码，保留语义重要的边、过滤噪声边
- 核心思路：对每条边 \((i,j)\) 计算注意力权重 \(\alpha_{i,j}^l = f_{\text{att}}(\mathbf{G}(\mathbf{e}_i, \mathbf{e}_j) \oplus \mathbf{G}(\mathbf{e}_j, \mathbf{e}_i) \oplus [\mathbf{e}_i; \mathbf{e}_j])\)，其中 \(\mathbf{G}(\cdot,\cdot)\) 是带自适应门控 \(\mathbf{g} = \sigma(\mathbf{W}_g[\mathbf{e}_i;\mathbf{e}_j]+\mathbf{b})\) 的特征组合函数。用 GRU 机制做关系过滤，concrete 分布实现可微边采样
- 设计动机：不同边对协同信号传播的贡献不同——噪声边（误点击等）应被抑制，真实偏好边应被保留。逐层掩码更灵活——不同 GNN 层需要不同的边重要性
扩散增强:
- 做什么：对 GCN 最后一层输出做 \(T\) 步前向加噪 + 学习反向去噪
- 核心思路：正向 \(\bm{\chi}_t = \sqrt{\bar{\alpha}_t}\bm{\chi}_0 + \sqrt{1-\bar{\alpha}_t}\bm{\epsilon}\)，MLP 预测 \(\hat{\bm{\chi}}_\theta(\bm{\chi}_t, t)\) 恢复原始嵌入。线性噪声调度器用 \(s, \alpha_{low}, \alpha_{up}\) 三参数控制噪声范围
- 设计动机：渐进加噪-去噪产生的视图同时具备多样性和结构保持性——比一步扰动更平滑。去噪过程本身就在抑制嵌入中的高频噪声
非对称对比学习 (ACL):
- 做什么：用双编码器 \(f_\theta, f_\xi\) 分别生成"身份表示"和"上下文表示"，通过非对称预测器重建邻域上下文
- 设计动机：推荐场景中用户和物品天然不对称——对称对比假设两者在嵌入空间中地位相同，但实际上用户的"身份"和其"邻域上下文"是不同的信息。非对称设计天然适应 monophily（两跳邻居通过共享中心节点拥有相似上下文）

训练策略¶

三阶段训练： - Phase 1: 联合优化 BPR + 扩散增强对比损失 + L2 正则 - Phase 2: 信息瓶颈约束（ACL 蒸馏） - Phase 3: 视图生成器优化（\(\mathcal{L}_{gen} + \mathcal{L}_{den}\)）

实验关键数据¶

二值边主实验（Last.FM / Yelp / BeerAdvocate）¶

方法	Last.FM R@20	Last.FM N@20	Yelp R@20	Yelp N@20	Beer R@20	Beer N@20
LightGCN	0.2349	0.1704	0.0761	0.0373	0.1102	0.0943
SGL	0.2427	0.1761	0.0803	0.0398	0.1138	0.0959
AdaGCL	0.2603	0.1911	0.0873	0.0439	0.1216	0.1015
RaDAR	0.2724	0.1992	0.0914	0.0464	0.1262	0.1056
提升	+4.65%	+4.24%	+4.70%	+5.69%	+3.78%	+4.04%

所有指标均统计显著（p < 0.01）。

加权边实验（Tmall / RetailRocket / IJCAI15）¶

方法	Tmall R@20	RetailRocket R@20	IJCAI15 R@20
DiffGraph	0.0553	0.0626	0.0178
RaDAR	0.0626	0.1380	0.0582

在 RetailRocket 上提升 120%+，在 IJCAI15 上提升 227%——加权边场景巨大优势。

消融实验¶

变体	Last.FM R@20	Last.FM N@20	说明
RaDAR（full）	0.2724	0.1992	完整模型
Gen+Gen（双 VGAE）	0.2665	0.1936	无关系感知去噪——R@20 -2.17%
Gen+Linear（线性替代去噪）	0.2698	0.1986	线性注意力替代——R@20 -0.95%
w/o D-ACL	0.2652	0.1934	无扩散+非对称对比
w/ ACL only	0.2720	0.1962	无扩散增强——NDCG 掉 1.5%

关系感知去噪模块对 Recall 贡献最大，扩散增强主要提升 NDCG（排序质量）。

噪声鲁棒性¶

在 Yelp（密度仅 \(1.6 \times 10^{-4}\)）上注入 5%-25% 噪声边后，RaDAR 相比 AdaGCL 和 SGL 的相对优势随噪声比例增大而扩大——极端稀疏条件下优势最显著。

亮点与洞察¶

扩散模型做嵌入增强的跨域思路：将扩散的噪声-去噪范式从图像生成迁移到图嵌入空间——渐进加噪天然适合产生多样但受控的增强视图，比随机扰动更优雅。可推广到任何需要对比学习的图场景。
关系感知去噪的"软增强"：不是删除/添加边的硬操作，而是学习逐层边权重——保留了梯度传播路径，避免组合爆炸。自适应门控 + concrete 分布的组合使得边选择可微且有概率解释。
非对称对比 ↔ 推荐场景的天然匹配：在推荐图中用户和物品角色本就不对称，强制对称对比在理论上不合理。解耦身份/上下文后，两跳邻居能通过共享的中心节点自然对齐。

局限性 / 可改进方向¶

训练复杂度高：三阶段训练 + 扩散 + VGAE + ACL，工程复杂度和计算成本都不低。尤其扩散的多步采样在大图上可能成为瓶颈
静态图假设：假设交互图是静态的，不处理时间动态——用户兴趣漂移无法建模。扩展到序列感知的扩散是论文自己提到的 future work
未与 LLM-based 推荐方法对比：近期 LLM4Rec 方向发展迅速，缺少与这类方法的比较
加权边实验结果异常好：RetailRocket 上 R@20 从 0.0626 跳到 0.1380，提升幅度达 120%，需要考虑是否存在实验设置差异

评分¶

新颖性: ⭐⭐⭐ 各组件单独不新（VGAE、扩散、ACL），但双视图 + 扩散 ACL 的系统性组合是合理的创新
实验充分度: ⭐⭐⭐⭐ 6 数据集（二值+加权）+ 消融 + 噪声鲁棒性 + 稀疏性分析 + 超参分析
写作质量: ⭐⭐⭐⭐ 框架清晰、实验设计系统，公式推导完整
价值: ⭐⭐⭐⭐ 对推荐系统中的对比学习范式有实质推进，加权边场景表现突出