跳转至

Bases of Steerable Kernels for Equivariant CNNs: From 2D Rotations to the Lorentz Group

会议: CVPR 2026
arXiv: 2603.12459
代码: 无
领域: 等变神经网络 / 群论
关键词: 可操纵卷积核、等变CNN、对称群、Lorentz群、绕过Clebsch-Gordan系数

一句话总结

提出一种直接从输入/输出表示构造可操纵核显式基的方法,无需计算 Clebsch-Gordan 系数,统一覆盖 SO(2)、O(2)、SO(3)、O(3) 到非紧致 Lorentz 群,大幅简化等变 CNN 的核设计流程。

背景与动机

等变 CNN 通过将对称先验硬编码进网络来提升性能。其核心技术挑战是求解可操纵核约束 K(g*x) = rho_out(g) K(x) rho_in(g)^{-1}。现有方法需要计算 Clebsch-Gordan (CG) 系数来做"耦合基-非耦合基"的变换,这对某些群(尤其是非紧致群如 Lorentz 群)计算困难甚至不可行。

核心问题

能否绕过 CG 系数的计算,直接从群表示矩阵元素出发,为任意对称群和张量类型特征图提供即用的可操纵核基?

方法详解

整体框架

核心思路分三步:(1) 选取轨道上某点 x0 及其稳定子群 H;(2) 在 x0 处求解简化约束 K(x0) 的同态空间——由 Schur 引理自动给出;(3) 用可操纵性方程 steering 把 K(x0) 推广到任意点 K(g*x0)。这一思路在文献中已有提及,但本文首次系统化展开并给出完整闭合公式。

关键设计

  1. 稳定子约束简化: 选定 x0 后,完整的可操纵约束退化为更简的不变性条件。对 SO(2),H 为恒等矩阵,约束自动满足;对 SO(3),H 约等于 SO(2),约束通过 Schur 引理按不可约分解块求解。
  2. Steering 操作: 将 x0 处的同态基通过群表示元素推到任意点,自然得到以 Wigner-D 矩阵元素表达的核基。谐波基函数"免费"出现,无需预先选择。
  3. 非紧致群扩展: 对 Lorentz 群 SO(1,3)+,分大质量和无质量两种情况。大质量情况用 SU(2) CG 系数(而非 Lorentz CG 系数)做子群分解;无质量情况用射影算子直接构造。半整数自旋通过荷共轭算子和 gamma 矩阵处理。

损失函数 / 训练策略

纯理论贡献,无训练过程。作者指出实现时可对 j 和 l 分别独立截断,比耦合基方法的单截断更灵活,可能提高网络表达能力。

实验关键数据

无数值实验。论文通过解析推导验证方法正确性: - SO(2) 的解严格复现了 Weiler et al. (2019) Table 8/9 的全部结果 - O(2) 的解匹配 Table 9 的对应案例 - SO(3) 的实数基维度 2min(j,l)+1 与已知理论一致 - Lorentz 群给出了时空张量互缠器等物理直觉清晰的形式

消融实验要点

对比了复数 vs 实数表示的自由参数维度差异:SO(3) 复数情况有 4min(j,l)+2 个实参数,实数情况仅 2min(j,l)+1 个,通过荷共轭对称性统一解释。

亮点

  • 方法的简洁性出色:对 SO(2) 全部推导仅需几行
  • 理论统一性强:同一框架从最简的 2D 旋转覆盖到非紧致 Lorentz 群
  • 对 Lorentz 群的处理基于物理直觉,给出了实际可用的射影算子形式
  • 明确指出 j、l 可独立截断带来的灵活性优势

局限性 / 可改进方向

  • 纯理论论文,未在任何视觉/物理任务上实验验证实际效果
  • 未与现有等变框架(e3nn、escnn)做计算效率对比
  • 非紧致群的不可约表示不唯一,仅考虑了完全可约情形
  • 混叠处理和具体实现细节留待未来工作

与相关工作的对比

  • vs Lang et al. (2021): 后者需计算 CG 系数+耦合基变换+逆变换,本文直接从表示矩阵元素一步到位
  • vs Weiler et al. (2019, E2CNN): 得到相同解空间但不同基元素,本文更直接
  • vs Bogatskiy et al. (2020, LorentzNet): 后者为 Lorentz 群计算 CG 系数,本文走不同路线
  • vs Finzi et al. (2021), Zhdanov et al. (2023/2024): 后者用 MLP 隐式参数化可操纵核,本文给出显式解析解

启发与关联

  • 为在物理模拟/粒子物理中构建 Lorentz 等变网络提供了更实用的核构造方案
  • 独立截断 j/l 的灵活性可能在等变架构搜索中有用

评分

  • 新颖性: ⭐⭐⭐⭐ 思路已有提及但首次系统展开到 Lorentz 群并给出完整公式
  • 实验充分度: ⭐⭐ 纯理论工作无实验,但解析验证充分
  • 写作质量: ⭐⭐⭐⭐ 数学严谨且为非专业读者提供了可及的讲解层次
  • 价值: ⭐⭐⭐ 为等变网络研究者提供了更直接的工具箱,但需实验验证实际影响