Ada3Drift: Adaptive Training-Time Drifting for One-Step 3D Visuomotor Robotic Manipulation¶

会议: CVPR 2026
arXiv: 2603.11984
代码: 待确认
领域: 具身智能 / 机器人操纵 / 扩散策略
关键词: 单步生成, 漂移场, 模态保持, 3D点云, flow matching

一句话总结¶

利用计算预算不对称性，将扩散策略的迭代细化从推理时移至训练时——通过自适应漂移场将预测动作吸引向专家模式并排斥其他生成样本，从3D点云实现单步（1 NFE）高保真多模态动作生成，比扩散策略快10倍以上。

扩散策略通过迭代去噪保持多模态动作分布，但需10-100 NFE无法实时控制。单步方法（FM/consistency）解决延迟但产生模态平均——在机器人中两种策略的平均（如绕障碍物左右两条路径）可能导致碰撞，是安全问题而非仅质量问题。

机器人系统具有计算预算不对称性（训练离线、推理实时）。能否将所有迭代细化移至训练时，推理仅需单步？核心挑战：few-shot数据（10-50 demo）下漂移场早期无法提供有效梯度；不同任务的动作分布几何差异大。

3D点云 → PointNet → 无时间步U-Net → 单步动作轨迹。训练时漂移场吸引向专家+排斥生成样本。

双向亲和漂移场: \(V(\hat{x}_i) = \sum_j W_{ij}^+ y_j^+ - \sum_k W_{ik}^- \hat{x}_k\)，吸引+排斥保持模态覆盖
Sigmoid调度: 前70%由MSE主导学粗分布，后30%漂移场接管做模态锐化
多温度聚合: \(\tau \in \{0.02, 0.05, 0.2\}\)，自归一化跨任务无需调参

\(\mathcal{L} = w_{drift}(e)\|\hat{x} - \text{sg}(\hat{x}+V)\|^2 + w_{mse}(e)\|\hat{x}-y^+\|^2\)；AdamW, lr=1e-4, batch=128

基准	Ada3Drift(1NFE)	DP3(10NFE)	FlowPolicy(1NFE)	MP1(1NFE)
Adroit+MetaWorld Avg SR%	79.2	78.0	77.0	78.6
RoboTwin Avg SR%	71.2	62.5	58.4	68.3
真实机器人 Avg SR%	79.0	68.0	57.0	69.0

vs FlowPolicy/MP1: 收敛到条件期望；vs DP3: 10步去噪慢12.5倍；vs Mean Flow: 排斥项显式分离模态

漂移场思路可迁移到dense prediction中多模态预测；多温度聚合是通用多尺度设计