跳转至

Geometry Distributions

会议: ICCV 2025
arXiv: 2411.16076
代码: 未公开
领域: 3D视觉
关键词: 几何表示, 扩散模型, 表面点分布, 神经压缩, 非水密网格

一句话总结

提出Geometry Distributions (GeomDist),将3D几何建模为表面点的概率分布并用扩散模型学习,无需假设亏格、连通性或边界条件,可从高斯噪声采样无限多表面点来表示任意拓扑的几何。

研究背景与动机

现有3D几何表示各有局限: - 网格:数据结构不一致,不适合学习 - 体素:内存密集,高分辨率需求大 - 点云:采样有限,缺乏连通性信息 - SDF:无法表示薄结构和非水密几何

核心洞见:任何表面都可以用足够多的采样点逼近,而生成模型理论上可以从分布中采样无限数据。因此将几何建模为表面点的分布 \(\Phi_{\mathcal{M}}\),使得 \(\mathbf{x} \sim \Phi_{\mathcal{M}} \Rightarrow \mathbf{x} \in \mathcal{M}\)

方法详解

问题建模

给定表面 \(\mathcal{M} \subset \mathbb{R}^3\),学习映射 \(\mathcal{E}\):从高斯分布到表面点分布。通过扩散模型 \(D_\theta(\cdot, \cdot)\) 学习,满足ODE:

\[\mathrm{d}\mathbf{x} = \frac{\mathbf{x} - D_\theta(\mathbf{x}, t)}{t} \mathrm{d}t\]

前向采样(高斯 → 表面)

从高斯噪声 \(\mathbf{x}_0 = T\mathbf{n}\) 出发,迭代计算:

\[\mathbf{x}_{i+1} = \mathbf{x}_i + (t_{i+1} - t_i) \cdot \frac{\mathbf{x}_i - D_\theta(\mathbf{x}_i, t_i)}{t_i}\]

终点 \(\mathbf{x}_N\) 落在目标表面上。采样任意多高斯点即可任意精度逼近表面。

逆向采样(表面 → 高斯)

从表面点出发反向遍历轨迹,映射回噪声空间:

\[\mathbf{x}_{i-1} = \mathbf{x}_i + (t_{i-1} - t_i) \cdot \frac{\mathbf{x}_i - D_\theta(\mathbf{x}_i, t_i)}{t_i}\]

实现表面点与噪声空间的一一对应。

训练过程

关键设计:每个epoch重新采样 \(2^{25}\) 个表面点。1000个epoch后网络见过足够多的表面点,模拟无限采样:

\[\arg\min_\theta \mathbb{E}_{\mathbf{x} \in \mathcal{M}} \mathbb{E}_{\mathbf{n} \sim \mathcal{N}} \mathbb{E}_{\sigma > 0} \|D_\theta(\mathbf{x} + \sigma\mathbf{n}, \sigma) - \mathbf{x}\|\]

网络设计

受EDM启发的magnitude-preserving层设计,6个块、C=512线性层,共5.53M参数。输入输出标准化为零均值单位方差。

实验

与SDF对比 (非水密物体)

方法 参数量 非水密支持 薄结构
SDF (Instant-NGP) 14M
GeomDist 5M

GeomDist用更少参数成功表示SDF无法处理的开放和非水密几何。

与向量场方法对比

方法 Chamfer Distance (×10³) 均匀性
向量场 4.886 不均匀
GeomDist 3.218 均匀

GeomDist在均匀性和几何保真度上均优于向量场方法。

多分辨率采样

在Wukong网格上从 \(n=2^{15}\)\(n=2^{19}\) 不同分辨率采样,均能准确逼近目标表面,展示了连续分辨率调整能力。

亮点与洞察

  1. 表示的普适性:不假设亏格、水密性、连通性——真正通用的几何表示
  2. 无限分辨率:理论上可采样无限多点,不受固定采样密度限制
  3. 紧凑性:5M参数编码复杂几何,远少于14M的SDF
  4. 可逆性:前向和逆向采样沿同一轨迹,实现表面点与噪声空间的双射
  5. 多应用支持:纹理网格表示、神经压缩、动态建模、高斯渲染

局限性

  • 训练时间较长(数小时),不适合实时应用
  • 每个物体需单独训练一个网络模型
  • 表面提取依赖后处理(如Ball Pivoting连接)
  • 未展示大规模场景的可扩展性

相关工作

  • SDF/UDF: 坐标基神经表示
  • Point-E, NeuralPoints: 点云生成
  • EDM: 扩散模型框架

评分

  • 新颖性: ⭐⭐⭐⭐⭐ (几何即分布的全新视角)
  • 技术深度: ⭐⭐⭐⭐⭐ (ODE框架+网络设计+训练策略)
  • 实验充分度: ⭐⭐⭐⭐ (多类物体+消融+应用)
  • 实用价值: ⭐⭐⭐⭐ (通用表示有广泛潜力)

相关论文