Full-DoF Egomotion Estimation for Event Cameras Using Geometric Solvers¶

会议: CVPR 2025
arXiv: 2503.03307
代码: https://github.com/jizhaox/relpose-event
领域: 其他
关键词: 事件相机、自运动估计、几何求解器、6-DoF位姿、共面约束

一句话总结¶

提出首个仅用事件流估计完整6-DoF自运动（角速度+线速度）的几何求解器方法，通过建立事件扇形流形上的线段几何约束——入射关系和新颖的共面关系，设计最少仅需8个事件的稀疏求解器，无需IMU即可解耦旋转和平移估计。

研究背景与动机¶

领域现状¶

领域现状：事件相机因高时间分辨率和高动态范围在机器人导航中广泛应用。现有事件相机运动估计方法大多假设旋转位移已知（由IMU提供），只估计平移部分，或者仅估计旋转。

现有痛点：（1）依赖IMU提供旋转先验限制了系统的独立性和轻量化；（2）仅估计平移或仅估计旋转无法满足完整6-DoF运动估计的需求；（3）现有方法缺乏从纯事件流恢复完整运动的理论基础。

核心矛盾：事件流（异步像素级亮度变化）与传统帧不同，无法直接使用经典的对极几何方法。如何从事件流的时空结构中提取6-DoF运动信号是开放问题。

本文目标 仅从事件流中恢复完整6-DoF自运动（3个角速度+3个线速度分量），无需IMU或其他外部传感器。

切入角度：利用事件扇形流形（eventail manifold）上的线段几何——每个事件在时空中形成射线，一组共线事件构成线段。通过线段间的入射关系（共享点）和共面关系（共享平面法向量）建立运动约束方程。

核心 idea：将事件流建模为时空线段集合，用线段间的入射关系和共面关系建立方程组，用最少8个事件的几何求解器恢复完整6-DoF自运动。

方法详解¶

整体框架¶

输入事件流\(\{(x_i, y_i, t_i, p_i)\}\)，在时空中构建eventail流形上的线段。通过两种几何约束建立关于运动参数\((\omega_x, \omega_y, \omega_z, v_x, v_y, v_z)\)的方程组：（1）入射关系（线上点约束）建立的线性方程；（2）共面关系（法向量约束）建立的双线性方程。使用Adam优化器和一阶旋转近似高效求解。特殊处理纯旋转退化情况。

关键设计¶

Eventail流形几何建模:
- 功能：将事件流转化为可利用的几何结构
- 核心思路：每个事件\((x, y, t)\)在3D时空中定义一条射线，同一边缘上的连续事件形成线段。这些线段的方向与像素速度成正比，像素速度由场景深度和自运动决定。通过聚合多个事件形成可靠的线段方向估计
- 设计动机：单个事件信息太少（仅一个亮度变化触发），但时空中的线段结构编码了运动信息
入射关系求解器（Incidence Relation）:
- 功能：通过线上点约束建立线性方程
- 核心思路：如果一个事件点落在某条线段上，其坐标满足线段方程。将运动参数代入线段方向表达式后得到关于\((\omega, v)\)的线性约束。最少需要8个约束（8个事件-线段对）构成线性方程组Ax=0
- 设计动机：线性方程求解快速稳定，是最小求解器的首选
共面关系求解器（Coplanarity Relation）:
- 功能：通过法向量约束提供额外约束
- 核心思路：如果两条线段共面，它们的方向向量和连接向量满足三重积为零的约束。这给出了关于运动参数的双线性方程\(n_1^T \cdot d_{12} = 0\)，其中\(n_1\)是法向量，\(d_{12}\)是两线段间的连接。这种约束不需要共享点，适用于空间中不相交的线段
- 设计动机：入射关系需要线段和点有明确的归属关系，共面关系更灵活——任意两条线段都可以产生约束

损失函数 / 训练策略¶

非学习方法，使用Adam优化器最小化几何残差。一阶旋转近似\(R \approx I + [\omega]_\times \Delta t\)简化非线性方程。对纯旋转退化情况有专门的理论分析和处理。

实验关键数据¶

主实验¶

在 VECtor 数据集的真实事件相机序列上评估，分割为 0.3 秒非重叠区间：

序列	IncBat \(\varepsilon_{ang}\)	IncBat \(\varepsilon_{lin}\)(°)	CopBat \(\varepsilon_{ang}\)	CopBat \(\varepsilon_{lin}\)(°)
desk-normal	0.232	23.0	0.236	25.1
mountain-normal	0.195	17.5	0.216	18.7
sofa-normal	0.229	21.1	0.221	20.6

其中 \(\varepsilon_{ang} \in [0,1]\)（越小越好），\(\varepsilon_{lin}\) 为角度误差（°）。

消融实验¶

运行时间与数值稳定性（M=5线段，N=100事件/线段，无噪声合成数据，1000场景）：

求解器	旋转参数化	SR1 (阈值0.01)	SR2 (阈值0.05)	中位运行时间
IncBat	+cascad	97.3%	—	17.1 ms
CopBat	+cascad	—	—	16.7~48.7 ms
IncBat	+exact	较低	—	较慢
IncBat	+approx	中等	—	较快

关键变量分析（M=10, N=8~1000，pixel噪声0.5pix，时间戳抖动0.5ms）： - 事件数<100时IncBat优于CopBat；事件数增大后两者趋于一致 - 线段数从1增至50时误差显著下降；M=1时旋转-平移模糊导致所有方法失败 - 噪声增大时误差单调增大；无噪声时求解器几乎100%成功

关键发现¶

cascade旋转参数化效果最好——先用一阶近似快速初始化，再用精确参数化精调，兼顾效率和精度
共面关系在线段不相交场景中提供了关键补充约束，是理论创新点
纯旋转是退化情况（平移不可估计），实际部署需要运动分类检测
实际误差水平（\(\varepsilon_{ang} \approx 0.2\), \(\varepsilon_{lin} \approx 20°\)）足以集成到VIO/SLAM管道中

亮点与洞察¶

理论贡献突出：首次证明仅用事件流可以恢复完整6-DoF运动，并给出了最少事件数的理论下界（8个）
共面关系的新颖性：传统线段几何主要用入射关系；共面关系不需要线段显式相交，大幅扩展了可用约束的数量
无需外部传感器：去除了IMU依赖，使纯事件相机的运动估计成为可能

局限与展望¶

一阶旋转近似仅在小运动下有效，快速旋转场景需要高阶展开
实际事件流中的噪声会影响线段方向估计的精度
缺少与基于学习的事件相机运动估计方法的定量对比
计算效率分析不够详细

评分¶

新颖性: ⭐⭐⭐⭐⭐ 首个纯事件6-DoF求解器，共面关系的理论贡献重大
实验充分度: ⭐⭐⭐ 理论严谨但实验规模偏小，缺少大规模定量对比
写作质量: ⭐⭐⭐⭐ 几何推导清晰，理论框架完整
价值: ⭐⭐⭐⭐ 对事件相机SLAM和自主导航有基础性贡献