Unified All-Atom Molecule Generation with Neural Fields¶

会议: NeurIPS 2025
arXiv: 2511.15906
代码: GitHub
领域: 医学图像 / 药物设计
关键词: 神经场, 分子生成, 全原子表示, 基于结构的药物设计, 扩散模型

一句话总结¶

提出 FuncBind 框架，利用神经场（Neural Fields）将分子表示为连续原子密度函数，构建统一的条件生成模型，能够同时处理小分子、大环肽和抗体 CDR 环三种药物模态的靶标条件生成。

研究背景与动机¶

基于结构的药物设计（SBDD）是药物发现的核心任务，目标是根据靶标蛋白的 3D 结构生成具有高亲和力的候选分子。当前的生成模型通常专注于单一分子模态：小分子模型使用点云或体素表示，蛋白质模型利用残基级别的点云并依赖序列数据库。这种模态特定的设计限制了模型的泛化能力——不同模态之间无法迁移，而实际药物发现中常涉及多模态的分子界面设计。

作者认为，模态无关的表示更适合跨模态学习，能够从更多样的训练数据中学习物理性质。已有工作如 AlphaFold3、RoseTTAFold 等在结构预测中的成功证明了跨模态统一建模的可行性。因此，本文提出用神经场作为分子的统一表示——将分子建模为从3D坐标到原子密度的连续函数——从而在一个模型中同时训练三种药物模态。

方法详解¶

整体框架¶

FuncBind 是一个两阶段的潜在空间条件生成模型： 1. 阶段一：训练神经场自编码器（VAE），学习分子的潜在表示 2. 阶段二：在潜在空间训练条件去噪器，用于生成新分子

生成时，输入靶标蛋白结构，采样噪声并通过去噪器迭代生成潜在向量，再通过解码器恢复原子密度场，最后经后处理得到分子结构。

关键设计¶

空间特征图神经场表示：不同于之前 FuncMol 使用全局嵌入，FuncBind 将潜在变量 \(z\) 组织为空间特征图（\(C \times L^3\)），每个空间位置的特征捕获局部信息。编码器 \(E_\psi\) 是 3D CNN，将分子的低分辨率体素映射到特征图空间。解码器 \(D_\phi\) 基于 Gabor 滤波器的乘法滤波网络，利用最近邻插值从特征图中提取位置相关嵌入 \(z_x\)，解码原子密度场：\(D_\phi(x, z_x) \to \mathbb{R}^n\)。这种设计既能捕获局部原子细节，又兼容 U-Net 等表达力强的去噪架构。VAE 训练损失为重建损失加 KL 正则化：

\[\mathcal{L}_{AE} = \sum_{v \in \mathcal{D}} \mathbb{E}_{z \sim q_\psi(z|v)} \left[\int \|D_\phi(x,z) - v(x)\|_2^2 dx\right] + \beta \text{KL}(q_\psi(z|v) \| \mathcal{N}(0,I_d))\]

条件去噪器：去噪器接收噪声潜在向量 \(y = z + \sigma\varepsilon\)，以靶标结构 \(z^{tar}\)、分子模态 \(c\) 和噪声水平 \(\sigma\) 为条件。靶标编码器 \(E_{\psi'}\) 与分子编码器架构相似但参数独立。核心网络 \(U_\theta\) 采用 3D U-Net，借鉴 Karras 的预处理方案：

\[\hat{z}_\theta(y|z^{tar}, \sigma, c) = \frac{1}{\sigma^2+1}y + \frac{\sigma}{\sqrt{\sigma^2+1}} U_\theta\left(\frac{y}{\sqrt{\sigma^2+1}}, z^{tar}, \frac{1}{4}\log\sigma, c\right)\]

关键决策是不使用 SE(3) 等变性约束，而是用数据增强（旋转和平移）替代。

采样策略：支持两种基于 score 的采样方法——扩散模型（通过反向 SDE 积分）和 Walk-Jump Sampling（单噪声水平采样，训练更简单、混合更快）。两者都利用 Tweedie-Miyasawa 公式将去噪器与条件 score 函数关联。

损失函数 / 训练策略¶

自编码器：重建损失 + KL 散度，训练时对原子中心附近的坐标上采样集中训练
去噪器：在多噪声水平上 MSE 去噪损失，采用 Karras 的自适应重加权方案
后处理：从生成的潜在码渲染出 0.25Å 分辨率体素，峰值检测+梯度上升定位原子坐标，OpenBabel 推断化学键和残基身份
模型规模达 5B 参数，在三种模态上联合训练

实验关键数据¶

主实验：小分子生成（CrossDocked2020）¶

指标	FuncBind	VoxBind（SOTA）	MolCraft	TargetDiff
VinaScore ↓	-5.71	-6.94	-6.59	-5.47
VinaDock ↓	-7.26	-8.30	-7.92	-7.80
QED ↑	0.50	0.57	0.50	0.48
SA ↑	0.65	0.70	0.69	0.58
Diversity ↑	0.70	0.73	0.72	0.72
Strain Energy ↓	217	162	195	1243
# Atoms	19.0	23.4	22.7	24.2

主实验：抗体 CDR 环重设计（SAbDab）¶

方法	H3-AAR ↑	H3-RMSD ↓	H1-AAR ↑	H1-RMSD ↓
FuncBind	47.5%	2.04 Å	86.9%	0.41 Å
AbDiffuser	34.1%	3.35 Å	76.3%	1.58 Å
DiffAb†	26.8%	3.60 Å	65.8%	1.19 Å
RAbD†	22.1%	2.90 Å	22.9%	2.26 Å

主实验：大环肽生成¶

方法	TS ↑	L-RMSD ↓	I-RMSD ↓	TM-Score ↑	Vina dock ↑
FuncBind	0.33	2.6 Å	1.8 Å	0.36	41%
AfCycDesign	0.34	7.6 Å	3.7 Å	0.33	29%
RFPeptide	0.31	12 Å	3.3 Å	0.33	8.8%

消融实验¶

配置	说明
统一模型 vs 单模态模型	性能相当，但统一模型的唯一性（uniqueness）显著更高
扩散 vs Walk-Jump Sampling	扩散在多数指标上表现更优；WJS 训练更简单、混合更快
全局嵌入 vs 空间特征图	空间特征图能更好扩展到大分子，兼容 U-Net 架构

关键发现¶

FuncBind 在 CDR 环重设计上的 AAR 和 RMSD 指标超越所有基线 1.5-3 倍
湿实验验证：H3 环重设计在刚性表位上达到 45% 结合率
能生成新颖且化学合理的非标准氨基酸（不到 1% 为不合理结构）
大环肽基准中生成 41% 的样本 Vina 对接得分优于种子分子

亮点与洞察¶

统一表示的威力：用神经场统一三种差异巨大的分子模态是一个优雅的设计，空间特征图的引入使其既能捕获局部精细结构，又兼容成熟的视觉网络架构
用数据增强替代等变性：放弃 SE(3) 等变约束，转而使用旋转/平移增强，简化了架构设计且不影响性能
湿实验闭环：在 CDR 设计上完成了从生成到实验验证的完整闭环，45% 的结合率具有实际转化价值
新基准贡献：引入 ~190K 合成大环肽/蛋白复合物数据集

局限与展望¶

小分子指标上仍略弱于 VoxBind/MolCraft 等专用模型
依赖准确的分子界面 3D 结构，而此类结构在实际药物发现中获取成本高
未处理可合成性（小分子）和可开发性（抗体）等实际应用约束
5B 参数的训练和推理成本极高，部署门槛高
跨模态迁移学习尚未深入探索

评分¶

新颖性: ⭐⭐⭐⭐ 统一三种分子模态的神经场方法新颖，但核心技术（VAE+扩散）较成熟
实验充分度: ⭐⭐⭐⭐⭐ 三模态全面评估 + 湿实验验证 + 新数据集贡献
写作质量: ⭐⭐⭐⭐ 结构清晰，技术描述完整
价值: ⭐⭐⭐⭐⭐ 统一分子生成框架具有重要实际意义，湿实验结果增强说服力