Mamba Learns in Context: Structure-Aware Domain Generalization for Multi-Task Point Cloud Understanding¶
日期: 2026-03-21
arXiv: 2603.20739
代码: GitHub
领域: 3D视觉
关键词: Mamba, point cloud, domain generalization, structure-aware serialization, in-context learning
一句话总结¶
提出 SADG,首个基于 Mamba 的多任务点云域泛化框架,通过质心距离谱(CDS)和测地线曲率谱(GCS)实现变换不变的结构感知序列化,配合层级域感知建模和谱图对齐,在重建/去噪/配准三任务上全面超越 SOTA(含引入新数据集 MP3DObject)。
研究背景与动机¶
-
领域现状: 3D 点云理解的 Transformer 方法(PointBERT 等)具备全局推理能力但复杂度 \(O(n^2)\);Mamba 提供线性时间序列建模但依赖坐标驱动序列化。
-
现有痛点: (a) 现有方法主要面向单任务单域,直接应用到多任务域泛化时性能下降;(b) Mamba 的坐标序列化(轴扫描、Hilbert 曲线)对视角变化和缺失区域敏感,破坏层级结构;(c) DG-PIC 用 Transformer 做多任务域泛化但计算昂贵且缺乏显式序列。
-
核心 idea: 用内在几何性质(质心拓扑 + 测地线曲率)替代坐标驱动序列化,使 Mamba 的循环状态传播反映物体的层级结构而非坐标位置,实现变换不变的稳定建模。
方法详解¶
整体框架¶
输入点云 → FPS+KNN 分 patch → 结构感知序列化(CDS+GCS 双谱双向) → 层级域感知建模(域内结构 + 域间融合) → 测试时谱图对齐。三个任务(重建、去噪、配准)统一在 ICL 框架下。
关键设计¶
-
质心距离谱(CDS)序列化:
- 构建 token 图,亲和力 \(w(i,j) = \exp(-\|u_i-u_j\|^2/\sigma^2)\)
- 从最近质心的 token 开始 BFS 遍历,按亲和力排序邻居
- 平衡全局覆盖和局部连续性——比单纯按距离排序多了空间平滑约束
- 变换不变:基于内在距离而非绝对坐标
-
测地线曲率谱(GCS)序列化:
- 计算测地线距离(KNN 图上的最短路径),构建 Laplace-Beltrami 算子
- 热核扩散 \(K_\tau(i,i)\) 隐式编码局部曲率——高曲率区域热耗散快
- 多尺度曲率描述子 \(h_i = [K_{\tau_1}(i,i), ..., K_{\tau_S}(i,i)]\)
- 从最低曲率 token 开始按曲率升序遍历,保持几何平滑性
- 避免显式法向量估计在噪声/缺失下的脆弱性
-
层级域感知建模(HDM):
- 域内结构建模(ISM): prompt 域和 query 域各自独立过 Mamba,保持域内结构一致性
- 域间关系融合(IRF): 按共享结构序交错排列两域 token \([z^p_1, z^q_1, z^p_2, z^q_2, ...]\),共享 Mamba 联合建模
- 交错排列比直接拼接更好——通过循环传播隐式交换特征
-
谱图对齐(SGA,测试时):
- 将序列化目标特征视为图信号,在谱域对齐到源域原型
- 无需更新模型参数,轻量级测试时自适应
统一序列¶
双谱双向拼接:\(X_{seq} = [X_{\pi_{CDS}}; X_{rev}; X_{\pi_{GCS}}; X_{rev}]\),Mamba 线性效率不变。
实验关键数据¶
主实验(Chamfer Distance ×10⁻³,越低越好)¶
五域 leave-one-out:ModelNet, ShapeNet, ScanNet, ScanObjectNN, MP3DObject
| 方法 | ModelNet Rec. | ShapeNet Den. | ScanObjectNN Reg. | MP3DObject Avg |
|---|---|---|---|---|
| DG-PIC (Transformer) | — | — | — | 基线 |
| SADG (Mamba) | 显著优于所有方法 | — | — | SOTA |
消融实验¶
| 配置 | 重建 CD | 去噪 CD | 配准 CD |
|---|---|---|---|
| 坐标排序 | 较差 | 较差 | 较差 |
| CDS only | 改善 | 改善 | 改善 |
| CDS + GCS | 最优 | 最优 | 最优 |
| w/o HDM | 下降 | 下降 | 下降 |
| w/o SGA | 下降 | — | 下降 |
关键发现¶
- 结构感知序列化对 Mamba 的域泛化至关重要——坐标排序在域偏移下不稳定
- CDS 贡献全局拓扑,GCS 贡献局部几何,两者互补
- 交错域间融合优于直接拼接——避免了序列边界的不连续性
亮点与洞察¶
- 内在几何序列化思路优雅:用热扩散隐式编码曲率避免了显式法向量的噪声敏感问题
- Mamba + ICL 的首次结合在点云域泛化中实现,证明线性复杂度模型可替代 Transformer
- 谱图对齐作为免训练测试时自适应方法值得借鉴
局限性 / 可改进方向¶
- BFS 遍历和热核计算引入额外预处理开销,具体延时未报告
- 仅验证三个任务(重建/去噪/配准),分类和分割等语义任务未覆盖
- MP3DObject 数据集规模和难度有待社区验证
评分¶
- 新颖性: ⭐⭐⭐⭐⭐ 结构感知序列化 + Mamba ICL 的融合是首创
- 实验充分度: ⭐⭐⭐⭐ 五域三任务全面评估,消融充分
- 价值: ⭐⭐⭐⭐ 为 Mamba 在 3D 域泛化开辟新方向