Bases of Steerable Kernels for Equivariant CNNs: From 2D Rotations to the Lorentz Group¶

会议: CVPR 2026
arXiv: 2603.12459
代码: 无
领域: 等变神经网络 / 群论
关键词: 可操纵卷积核、等变CNN、对称群、Lorentz群、绕过Clebsch-Gordan系数

一句话总结¶

提出一种直接从输入/输出表示构造可操纵核显式基的方法，无需计算 Clebsch-Gordan 系数，统一覆盖 SO(2)、O(2)、SO(3)、O(3) 到非紧致 Lorentz 群，大幅简化等变 CNN 的核设计流程。

背景与动机¶

等变 CNN 通过将对称先验硬编码进网络来提升性能。其核心技术挑战是求解可操纵核约束 K(g*x) = rho_out(g) K(x) rho_in(g)^{-1}。现有方法需要计算 Clebsch-Gordan (CG) 系数来做"耦合基-非耦合基"的变换，这对某些群（尤其是非紧致群如 Lorentz 群）计算困难甚至不可行。

核心问题¶

能否绕过 CG 系数的计算，直接从群表示矩阵元素出发，为任意对称群和张量类型特征图提供即用的可操纵核基？

方法详解¶

整体框架¶

核心思路分三步：(1) 选取轨道上某点 x0 及其稳定子群 H；(2) 在 x0 处求解简化约束 K(x0) 的同态空间——由 Schur 引理自动给出；(3) 用可操纵性方程 steering 把 K(x0) 推广到任意点 K(g*x0)。这一思路在文献中已有提及，但本文首次系统化展开并给出完整闭合公式。

关键设计¶

稳定子约束简化: 选定 x0 后，完整的可操纵约束退化为更简的不变性条件。对 SO(2)，H 为恒等矩阵，约束自动满足；对 SO(3)，H 约等于 SO(2)，约束通过 Schur 引理按不可约分解块求解。
Steering 操作: 将 x0 处的同态基通过群表示元素推到任意点，自然得到以 Wigner-D 矩阵元素表达的核基。谐波基函数"免费"出现，无需预先选择。
非紧致群扩展: 对 Lorentz 群 SO(1,3)+，分大质量和无质量两种情况。大质量情况用 SU(2) CG 系数（而非 Lorentz CG 系数）做子群分解；无质量情况用射影算子直接构造。半整数自旋通过荷共轭算子和 gamma 矩阵处理。

损失函数 / 训练策略¶

纯理论贡献，无训练过程。作者指出实现时可对 j 和 l 分别独立截断，比耦合基方法的单截断更灵活，可能提高网络表达能力。

实验关键数据¶

无数值实验。论文通过解析推导验证方法正确性： - SO(2) 的解严格复现了 Weiler et al. (2019) Table 8/9 的全部结果 - O(2) 的解匹配 Table 9 的对应案例 - SO(3) 的实数基维度 2min(j,l)+1 与已知理论一致 - Lorentz 群给出了时空张量互缠器等物理直觉清晰的形式

消融实验要点¶

对比了复数 vs 实数表示的自由参数维度差异：SO(3) 复数情况有 4min(j,l)+2 个实参数，实数情况仅 2min(j,l)+1 个，通过荷共轭对称性统一解释。

亮点¶

方法的简洁性出色：对 SO(2) 全部推导仅需几行
理论统一性强：同一框架从最简的 2D 旋转覆盖到非紧致 Lorentz 群
对 Lorentz 群的处理基于物理直觉，给出了实际可用的射影算子形式
明确指出 j、l 可独立截断带来的灵活性优势

局限性 / 可改进方向¶

纯理论论文，未在任何视觉/物理任务上实验验证实际效果
未与现有等变框架（e3nn、escnn）做计算效率对比
非紧致群的不可约表示不唯一，仅考虑了完全可约情形
混叠处理和具体实现细节留待未来工作

与相关工作的对比¶

vs Lang et al. (2021): 后者需计算 CG 系数+耦合基变换+逆变换，本文直接从表示矩阵元素一步到位
vs Weiler et al. (2019, E2CNN): 得到相同解空间但不同基元素，本文更直接
vs Bogatskiy et al. (2020, LorentzNet): 后者为 Lorentz 群计算 CG 系数，本文走不同路线
vs Finzi et al. (2021), Zhdanov et al. (2023/2024): 后者用 MLP 隐式参数化可操纵核，本文给出显式解析解

启发与关联¶

为在物理模拟/粒子物理中构建 Lorentz 等变网络提供了更实用的核构造方案
独立截断 j/l 的灵活性可能在等变架构搜索中有用

评分¶

新颖性: ⭐⭐⭐⭐ 思路已有提及但首次系统展开到 Lorentz 群并给出完整公式
实验充分度: ⭐⭐ 纯理论工作无实验，但解析验证充分
写作质量: ⭐⭐⭐⭐ 数学严谨且为非专业读者提供了可及的讲解层次
价值: ⭐⭐⭐ 为等变网络研究者提供了更直接的工具箱，但需实验验证实际影响