CUBE: Representing 3D Faces with Learnable B-Spline Volumes¶

会议: CVPR 2026
arXiv: 2604.12894
代码: 无
领域: 3D视觉 / 人脸重建
关键词: B样条体, 人脸表示, 扫描配准, 局部控制, 几何编辑

一句话总结¶

提出 CUBE（Control-based Unified B-spline Encoding），一种结合 B 样条体和可学习高维控制特征的混合几何表示，通过两阶段解码（B 样条基插值 + 轻量 MLP 残差）实现可编辑、高精度的 3D 人脸重建和扫描配准。

领域现状：3D 人脸表示主要有三种范式：3D 形变模型（3DMM）提供压缩、解缠的线性空间但细节有限；非线性神经模型提升灵活性但缺乏可解释性和局部控制；隐式表示提供高细节但缺乏语义对应且需要昂贵的等值面提取。

现有痛点：3DMM 受限于固定拓扑和低维参数空间，无法捕获个体化高频细节。神经模型缺乏局部编辑能力。隐式模型与标准图形管线不兼容。

核心矛盾：表示的局部可控性、几何表达力和计算效率三者难以兼顾。

本文目标：设计一种兼具 B 样条局部控制特性和神经网络表达力的混合人脸表示。

切入角度：将传统 B 样条体的 3D 控制点替换为高维可学习控制特征，用轻量 MLP 补充高频细节。

核心 idea：高维控制特征格（如 8×8×8）定义连续的参数域到欧式空间映射，B 样条基提供局部支持属性实现局部编辑。

CUBE 由高维控制特征格参数化。给定固定模板网格上的 3D 坐标，B 样条基局部混合控制特征产生高维向量，其前三维定义基础网格位置，完整特征送入轻量 MLP 预测残差位移。输出为密集语义对应的 3D 表面。

高维控制特征格:
- 功能：用紧凑的格点替代稠密网格参数化 3D 人脸形状
- 核心思路：传统 B 样条体用 3D 控制点，CUBE 用高维（如 32 维）控制特征替代。B 样条基在查询点处局部混合邻域控制特征，产生高维特征向量。这保留了 B 样条的局部支持特性——修改单个控制特征只影响局部区域
- 设计动机：标准 B 样条的 3D 控制点表达力不足以用少量格点表示复杂人脸形状
两阶段解码:
- 功能：兼顾全局形状和局部细节
- 核心思路：混合后的高维特征向量的前三维直接定义粗糙的基础网格（全局形状），完整特征向量再送入轻量 MLP 预测从基础形状的残差位移（高频细节）
- 设计动机：B 样条基天然平滑，难以表示高频几何。MLP 补充了这一表达力，同时保持局部支持（因为 MLP 输入来自局部混合的特征）
基于 Transformer 的编码器:
- 功能：从非结构化点云或单目图像预测 CUBE 控制特征
- 核心思路：训练 Transformer 编码器将非结构化 3D 头部扫描（或单目图像）映射为 CUBE 控制特征格，实现前馈式扫描配准和图像重建
- 设计动机：CUBE 的参数空间紧凑（如 8³×32 = 16K 参数），适合直接回归

顶点到顶点 L2 损失 + 法线一致性损失 + 拉普拉斯平滑正则化。编码器和 CUBE 解码器端到端训练。

方法	类型	扫描配准误差↓	对应精度↑
BPS	基点集	2.85	82.3%
Shape-my-face	PointNet	2.42	85.1%
ImFace	隐式	2.15	87.5%
CUBE	B样条	1.89	91.2%