Efficient Spiking Point Mamba for Point Cloud Analysis¶
元信息¶
- 会议: ICCV 2025
- arXiv: 2504.14371
- 代码: 未公开
- 领域: 3D 视觉 / 点云分析
- 关键词: SNN, Mamba, 点云分析, 脉冲神经网络, 能量效率
一句话总结¶
SPM(Spiking Point Mamba)提出首个基于 Mamba 的 3D 脉冲神经网络框架,通过层次化动态编码(HDE)和脉冲 Mamba 模块(SMB),在大幅降低能耗(3.5× 以上)的同时,在 ScanObjectNN 上比前 SOTA SNN 方法提升 6-7% 的准确率。
研究背景与动机¶
脉冲神经网络(SNN)因其事件驱动特性在能效方面具有显著优势,但在 3D 点云分析中面临三个关键挑战:
长距离依赖建模困难:现有 MLP 和 Transformer 基础的 SNN 架构难以捕获不规则点序列中的远程依赖
静态时间编码:传统 direct encoding 沿时间维度简单重复输入,无法充分利用 SNN 时间特征提取能力
脉冲信息退化:脉冲驱动计算过程中信息密度显著低于 ANN(每个时间步激活减少约 30%),整合 Mamba 等序列模型时问题加剧
Mamba 提供了线性复杂度的序列建模能力,但直接迁移到 SNN 存在时间复杂度不匹配(连续状态转移 vs 离散脉冲事件)和信息密度差异的问题。
方法详解¶
整体框架¶
SPM 由三部分组成: 1. HDE(层次化动态编码):将静态点云转换为层次化的动态事件表示 2. SEL(脉冲嵌入层):将 token 映射到高维语义特征 3. SMB(脉冲 Mamba 模块):核心组件,堆叠 N=12 次进行特征交互
关键设计一:层次化动态编码(HDE)¶
传统 SNN 使用 direct encoding,直接在时间维度重复输入,导致时间特征提取失效。HDE 根据最远点采样(FPS)的三个阶段引入动态变化:
- 早期阶段(不稳定):因随机初始选择导致不稳定
- 中期阶段(稳定):有效捕获点云骨架结构
- 晚期阶段(冗余):可能引入噪声
HDE 的具体策略: - Finite Forward Sliding:在早期和中期动态滑动选取 F 个点,步长 l 随时间递减 - Infinite Backward Extension:在晚期从剩余点中动态选取 r 个点作为记忆池
关键设计二:脉冲 Mamba 模块(SMB)¶
SMB 是 SPM 的核心,包含两个分支:
SSM 分支: - 输入 spike 经 FC 层和 SN 提取中间特征 - 仅翻转时间维度(而非 token 维度),因为稀疏脉冲矩阵的 token 翻转无意义 - 双向 SSM 学习时间步间的动态关系
Gate 分支: - 将 spike 映射到高维生成门控矩阵 - 不直接做逐元素乘法(会导致严重信息丢失),而是先在 token 维度做 Element-wise Average Pooling(EAP) - 保留重要特征维度,维持 token 间关系
SMB 的数学表达:
关键设计三:脉冲预训练¶
采用非对称 SNN-ANN 异构编码器-解码器架构: - 编码器:N 个 SMB 堆叠(SNN) - 解码器:\(N_d\) 个单向 SSM(ANN,\(N_d < N\)) - 使用 Chamfer Distance 作为重建损失 - SNN-ANN 解耦设计:利用 ANN 解码器的建模能力增强 SNN 编码器
能耗分析¶
SPM 将 ANN 中的矩阵乘法(MAC,4.6 pJ)转换为稀疏累加(AC,0.9 pJ)。能耗主要来自 SEL 和 SMB 模块。
实验关键数据¶
主实验:3D 分类(ScanObjectNN + ModelNet40)¶
| 架构 | 方法 | 参数 | T | OBJ-BG | OBJ-ONLY | PB-T50-RS | ModelNet40 |
|---|---|---|---|---|---|---|---|
| ANN | PointMamba | 12.3 | - | 90.2 | 89.8 | 85.4 | 92.4 |
| SNN | Spiking PointNet | 3.5 | 4 | 72.2 | 76.4 | 64.1 | 88.2 |
| SNN | P2SResLNet-B | 14.3 | 1 | 78.6 | 80.2 | 74.5 | 88.7 |
| SNN | SPT | 10.2 | 4 | 82.8 | 83.4 | 78.0 | 91.4 |
| SNN | SPM (Ours) | 12.8 | 4 | 90.2 (+7.4) | 89.5 (+6.1) | 84.2 (+6.2) | 92.3 (+0.9) |
消融实验:SMB 设计¶
| 模型 | Gate 分支 | SSM 分支 | OBJ-BG | PB-T50-RS | ModelNet40 |
|---|---|---|---|---|---|
| Model I(vanilla Gate + 单向) | Gate I | uni. | 88.3 | 83.1 | 91.4 |
| Model II(vanilla Gate + 双向) | Gate I | bi. | 89.3 | 83.8 | 91.8 |
| Model III(SNN Gate + 单向) | Gate II | uni. | 88.9 | 83.5 | 91.6 |
| SMB(完整设计) | Gate II | bi. | 90.2 | 84.2 | 92.3 |
时间步与能耗¶
| 时间步 | 能耗(mJ) | OBJ-BG | PB-T50-RS | ModelNet40 |
|---|---|---|---|---|
| ANN | 18.9 | 90.2 | 85.4 | 92.4 |
| 1 | 1.5 | 88.9 | 83.3 | 91.6 |
| 4 | 5.4 | 90.2 | 84.2 | 92.3 |
| 6 | 7.6 | 90.0 | 84.3 | 92.3 |
关键发现¶
- SNN SOTA 大幅提升:在 ScanObjectNN 三个变体上比之前最优 SNN 方法(SPT)提升 6-7%
- 接近 ANN 性能:SPM 在分类上达到了 ANN 对应方法 PointMamba 的水平
- 能耗仅为 ANN 的 1/3.5:时间步为 4 时性能与 ANN 持平,能耗 5.4mJ vs 18.9mJ
- 预训练有效:脉冲预训练在 PB-T50-RS 上额外提升 2.3%(84.2→86.5)
- 时间翻转优于 Token 翻转:双向策略中,翻转时间维度比翻转 token 维度效果好
亮点与洞察¶
- 首个 3D Mamba SNN:成功将 Mamba 引入 3D SNN 领域,解决了脉冲与连续状态的兼容性问题
- HDE 的巧妙设计:利用 FPS 三阶段特性自然引入时间动态,不引入额外参数
- EAP 门控:通过 token 维度的平均池化避免脉冲乘法的信息丢失,简单有效
- 异构预训练:SNN 编码 + ANN 解码的非对称设计,推理时仅需 SNN,保持低能耗
局限性¶
- 最大时间步仅测试到 6,受计算成本限制
- ShapeNetPart 分割任务上与 ANN 仍有差距(84.8 vs 85.8 ins. mIoU)
- 仅在较小规模数据集上验证,未在大规模真实场景数据集上测试
- 依赖特定的脉冲神经元模型(LIF),对其他神经元模型的适用性未探索
相关工作与启发¶
- PointMamba:ANN 版本的 Point Mamba,SPM 以此为基础构建 SNN 版本
- Spiking Point Transformer (SPT):前 SNN SOTA,基于 Transformer 架构
- TA-TiTok / S4D / Mamba:SPM 集成了 SSM 的高效序列建模与 SNN 的低能耗优势
评分¶
⭐⭐⭐⭐ — 首创性强且实验充分,在 SNN 领域实现了跨越式进步,但实际应用场景和更大规模验证有待加强。
相关论文¶
- [ICCV 2025] Egocentric Action-aware Inertial Localization in Point Clouds with Vision-Language Guidance
- [ICCV 2025] ResGS: Residual Densification of 3D Gaussian for Efficient Detail Recovery
- [CVPR 2025] DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction
- [ICCV 2025] RI3D: Few-Shot Gaussian Splatting With Repair and Inpainting Diffusion Priors
- [ICCV 2025] Identity Preserving 3D Head Stylization with Multiview Score Distillation