跳转至

RaDAR: Relation-aware Diffusion-Asymmetric Graph Contrastive Learning for Recommendation

日期: 2026-03-17
arXiv: 2603.16800
代码: GitHub
领域: 推荐系统
关键词: 推荐系统, 扩散增强, 图对比学习, 关系感知去噪, 非对称对比学习

一句话总结

提出 RaDAR 框架,通过双视图生成(VGAE 全局结构 + 关系感知边去噪)与扩散增强的非对称对比学习,在 3 个二值边和 3 个加权边推荐基准上全面 SOTA,特别在高稀疏和高噪声条件下相比 AdaGCL 提升 3-5%。

研究背景与动机

  1. 领域现状: 协同过滤(CF)通过 GNN 在用户-物品二部图上建模高阶连通性。图对比学习(GCL)进一步通过多视图增强提升表示质量——SGL 用随机节点/边 dropout,SimGCL 用特征空间噪声,AdaGCL 引入可训练视图生成器。

  2. 现有痛点: (a) 结构语义退化:随机边扰动会破坏关键拓扑结构和协同信号,导致增强视图间语义不一致——例如删掉一条高频交互边,可能切断重要用户偏好路径;(b) 关系表达能力有限:现有方法假设同质性(homophily),只关注一跳邻居对齐,但真实用户交互常具异质性或远程同质性——例如两个兴趣相似的用户可能通过多跳路径连接而无直接交互。

  3. 核心矛盾: 增强视图需要同时满足两个矛盾目标:足够多样以提供有价值的对比信号,又不能破坏图的结构语义。随机扰动在多样性和语义保持之间无法平衡。

  4. 本文解决什么: 设计统一模型同时实现增强过程中的结构语义保持和多跳/异质邻域下的关系感知表达。

  5. 核心 idea 一句话: 用扩散模型做嵌入空间的渐进噪声注入-去噪实现鲁棒增强,用 VGAE + 关系感知边去噪模块做双视图生成,用非对称对比解耦节点身份与结构上下文。

方法详解

整体框架

RaDAR 包含四个组件,输入用户-物品交互二部图: 1. GNN 编码器:LightGCN 式多层消息传递 → 用户/物品嵌入 2. 双视图生成器:VGAE 生成全局视图 + 关系感知去噪生成局部视图 3. 扩散增强模块:对嵌入做正向噪声注入 + 反向学习去噪 4. 非对称对比优化:解耦身份表示和上下文表示,三阶段训练

关键设计

  1. VGAE 全局视图生成器:

    • 做什么:通过变分图自编码器捕获全局结构语义,生成重建图视图
    • 核心思路:GCN 编码器产生节点嵌入后高斯采样 → 解码器重建图结构。优化 KL 散度正则、图重建判别损失、BPR 排序损失的联合目标
    • 设计动机:VGAE 学到的潜在空间自然编码了全局连通性模式,生成的视图保持结构语义完整性——替代随机扰动
  2. 关系感知边去噪模块:

    • 做什么:用自适应门控机制做逐层边掩码,保留语义重要的边、过滤噪声边
    • 核心思路:对每条边 \((i,j)\) 计算注意力权重 \(\alpha_{i,j}^l = f_{\text{att}}(\mathbf{G}(\mathbf{e}_i, \mathbf{e}_j) \oplus \mathbf{G}(\mathbf{e}_j, \mathbf{e}_i) \oplus [\mathbf{e}_i; \mathbf{e}_j])\),其中 \(\mathbf{G}(\cdot,\cdot)\) 是带自适应门控 \(\mathbf{g} = \sigma(\mathbf{W}_g[\mathbf{e}_i;\mathbf{e}_j]+\mathbf{b})\) 的特征组合函数。用 GRU 机制做关系过滤,concrete 分布实现可微边采样
    • 设计动机:不同边对协同信号传播的贡献不同——噪声边(误点击等)应被抑制,真实偏好边应被保留。逐层掩码更灵活——不同 GNN 层需要不同的边重要性
  3. 扩散增强:

    • 做什么:对 GCN 最后一层输出做 \(T\) 步前向加噪 + 学习反向去噪
    • 核心思路:正向 \(\bm{\chi}_t = \sqrt{\bar{\alpha}_t}\bm{\chi}_0 + \sqrt{1-\bar{\alpha}_t}\bm{\epsilon}\),MLP 预测 \(\hat{\bm{\chi}}_\theta(\bm{\chi}_t, t)\) 恢复原始嵌入。线性噪声调度器用 \(s, \alpha_{low}, \alpha_{up}\) 三参数控制噪声范围
    • 设计动机:渐进加噪-去噪产生的视图同时具备多样性和结构保持性——比一步扰动更平滑。去噪过程本身就在抑制嵌入中的高频噪声
  4. 非对称对比学习 (ACL):

    • 做什么:用双编码器 \(f_\theta, f_\xi\) 分别生成"身份表示"和"上下文表示",通过非对称预测器重建邻域上下文
    • 设计动机:推荐场景中用户和物品天然不对称——对称对比假设两者在嵌入空间中地位相同,但实际上用户的"身份"和其"邻域上下文"是不同的信息。非对称设计天然适应 monophily(两跳邻居通过共享中心节点拥有相似上下文)

训练策略

三阶段训练: - Phase 1: 联合优化 BPR + 扩散增强对比损失 + L2 正则 - Phase 2: 信息瓶颈约束(ACL 蒸馏) - Phase 3: 视图生成器优化(\(\mathcal{L}_{gen} + \mathcal{L}_{den}\)

实验关键数据

二值边主实验(Last.FM / Yelp / BeerAdvocate)

方法 Last.FM R@20 Last.FM N@20 Yelp R@20 Yelp N@20 Beer R@20 Beer N@20
LightGCN 0.2349 0.1704 0.0761 0.0373 0.1102 0.0943
SGL 0.2427 0.1761 0.0803 0.0398 0.1138 0.0959
AdaGCL 0.2603 0.1911 0.0873 0.0439 0.1216 0.1015
RaDAR 0.2724 0.1992 0.0914 0.0464 0.1262 0.1056
提升 +4.65% +4.24% +4.70% +5.69% +3.78% +4.04%

所有指标均统计显著(p < 0.01)。

加权边实验(Tmall / RetailRocket / IJCAI15)

方法 Tmall R@20 RetailRocket R@20 IJCAI15 R@20
DiffGraph 0.0553 0.0626 0.0178
RaDAR 0.0626 0.1380 0.0582

在 RetailRocket 上提升 120%+,在 IJCAI15 上提升 227%——加权边场景巨大优势。

消融实验

变体 Last.FM R@20 Last.FM N@20 说明
RaDAR(full) 0.2724 0.1992 完整模型
Gen+Gen(双 VGAE) 0.2665 0.1936 无关系感知去噪——R@20 -2.17%
Gen+Linear(线性替代去噪) 0.2698 0.1986 线性注意力替代——R@20 -0.95%
w/o D-ACL 0.2652 0.1934 无扩散+非对称对比
w/ ACL only 0.2720 0.1962 无扩散增强——NDCG 掉 1.5%

关系感知去噪模块对 Recall 贡献最大,扩散增强主要提升 NDCG(排序质量)。

噪声鲁棒性

在 Yelp(密度仅 \(1.6 \times 10^{-4}\))上注入 5%-25% 噪声边后,RaDAR 相比 AdaGCL 和 SGL 的相对优势随噪声比例增大而扩大——极端稀疏条件下优势最显著。

亮点与洞察

  • 扩散模型做嵌入增强的跨域思路:将扩散的噪声-去噪范式从图像生成迁移到图嵌入空间——渐进加噪天然适合产生多样但受控的增强视图,比随机扰动更优雅。可推广到任何需要对比学习的图场景。
  • 关系感知去噪的"软增强":不是删除/添加边的硬操作,而是学习逐层边权重——保留了梯度传播路径,避免组合爆炸。自适应门控 + concrete 分布的组合使得边选择可微且有概率解释。
  • 非对称对比 ↔ 推荐场景的天然匹配:在推荐图中用户和物品角色本就不对称,强制对称对比在理论上不合理。解耦身份/上下文后,两跳邻居能通过共享的中心节点自然对齐。

局限性 / 可改进方向

  • 训练复杂度高:三阶段训练 + 扩散 + VGAE + ACL,工程复杂度和计算成本都不低。尤其扩散的多步采样在大图上可能成为瓶颈
  • 静态图假设:假设交互图是静态的,不处理时间动态——用户兴趣漂移无法建模。扩展到序列感知的扩散是论文自己提到的 future work
  • 未与 LLM-based 推荐方法对比:近期 LLM4Rec 方向发展迅速,缺少与这类方法的比较
  • 加权边实验结果异常好:RetailRocket 上 R@20 从 0.0626 跳到 0.1380,提升幅度达 120%,需要考虑是否存在实验设置差异

相关工作与启发

  • vs SGL: 随机边/节点 dropout 破坏结构语义——RaDAR 用学习型视图生成替代随机扰动
  • vs AdaGCL: 也用可训练视图生成器,但只有单个增强策略。RaDAR 的双视图(VGAE + 关系感知去噪)捕获互补信息——全局结构 vs 局部边细化
  • vs DiffGraph: 同样用扩散做图推荐,但 DiffGraph 做异质图结构扩散,RaDAR 做嵌入空间扩散 + 边去噪——切入点不同

评分

  • 新颖性: ⭐⭐⭐ 各组件单独不新(VGAE、扩散、ACL),但双视图 + 扩散 ACL 的系统性组合是合理的创新
  • 实验充分度: ⭐⭐⭐⭐ 6 数据集(二值+加权)+ 消融 + 噪声鲁棒性 + 稀疏性分析 + 超参分析
  • 写作质量: ⭐⭐⭐⭐ 框架清晰、实验设计系统,公式推导完整
  • 价值: ⭐⭐⭐⭐ 对推荐系统中的对比学习范式有实质推进,加权边场景表现突出