跳转至

Unified All-Atom Molecule Generation with Neural Fields

会议: NeurIPS 2025
arXiv: 2511.15906
代码: GitHub
领域: 医学图像 / 药物设计
关键词: 神经场, 分子生成, 全原子表示, 基于结构的药物设计, 扩散模型

一句话总结

提出 FuncBind 框架,利用神经场(Neural Fields)将分子表示为连续原子密度函数,构建统一的条件生成模型,能够同时处理小分子、大环肽和抗体 CDR 环三种药物模态的靶标条件生成。

研究背景与动机

基于结构的药物设计(SBDD)是药物发现的核心任务,目标是根据靶标蛋白的 3D 结构生成具有高亲和力的候选分子。当前的生成模型通常专注于单一分子模态:小分子模型使用点云或体素表示,蛋白质模型利用残基级别的点云并依赖序列数据库。这种模态特定的设计限制了模型的泛化能力——不同模态之间无法迁移,而实际药物发现中常涉及多模态的分子界面设计。

作者认为,模态无关的表示更适合跨模态学习,能够从更多样的训练数据中学习物理性质。已有工作如 AlphaFold3、RoseTTAFold 等在结构预测中的成功证明了跨模态统一建模的可行性。因此,本文提出用神经场作为分子的统一表示——将分子建模为从3D坐标到原子密度的连续函数——从而在一个模型中同时训练三种药物模态。

方法详解

整体框架

FuncBind 是一个两阶段的潜在空间条件生成模型: 1. 阶段一:训练神经场自编码器(VAE),学习分子的潜在表示 2. 阶段二:在潜在空间训练条件去噪器,用于生成新分子

生成时,输入靶标蛋白结构,采样噪声并通过去噪器迭代生成潜在向量,再通过解码器恢复原子密度场,最后经后处理得到分子结构。

关键设计

  1. 空间特征图神经场表示:不同于之前 FuncMol 使用全局嵌入,FuncBind 将潜在变量 \(z\) 组织为空间特征图(\(C \times L^3\)),每个空间位置的特征捕获局部信息。编码器 \(E_\psi\) 是 3D CNN,将分子的低分辨率体素映射到特征图空间。解码器 \(D_\phi\) 基于 Gabor 滤波器的乘法滤波网络,利用最近邻插值从特征图中提取位置相关嵌入 \(z_x\),解码原子密度场:\(D_\phi(x, z_x) \to \mathbb{R}^n\)。这种设计既能捕获局部原子细节,又兼容 U-Net 等表达力强的去噪架构。VAE 训练损失为重建损失加 KL 正则化:
\[\mathcal{L}_{AE} = \sum_{v \in \mathcal{D}} \mathbb{E}_{z \sim q_\psi(z|v)} \left[\int \|D_\phi(x,z) - v(x)\|_2^2 dx\right] + \beta \text{KL}(q_\psi(z|v) \| \mathcal{N}(0,I_d))\]
  1. 条件去噪器:去噪器接收噪声潜在向量 \(y = z + \sigma\varepsilon\),以靶标结构 \(z^{tar}\)、分子模态 \(c\) 和噪声水平 \(\sigma\) 为条件。靶标编码器 \(E_{\psi'}\) 与分子编码器架构相似但参数独立。核心网络 \(U_\theta\) 采用 3D U-Net,借鉴 Karras 的预处理方案:
\[\hat{z}_\theta(y|z^{tar}, \sigma, c) = \frac{1}{\sigma^2+1}y + \frac{\sigma}{\sqrt{\sigma^2+1}} U_\theta\left(\frac{y}{\sqrt{\sigma^2+1}}, z^{tar}, \frac{1}{4}\log\sigma, c\right)\]

关键决策是不使用 SE(3) 等变性约束,而是用数据增强(旋转和平移)替代。

  1. 采样策略:支持两种基于 score 的采样方法——扩散模型(通过反向 SDE 积分)和 Walk-Jump Sampling(单噪声水平采样,训练更简单、混合更快)。两者都利用 Tweedie-Miyasawa 公式将去噪器与条件 score 函数关联。

损失函数 / 训练策略

  • 自编码器:重建损失 + KL 散度,训练时对原子中心附近的坐标上采样集中训练
  • 去噪器:在多噪声水平上 MSE 去噪损失,采用 Karras 的自适应重加权方案
  • 后处理:从生成的潜在码渲染出 0.25Å 分辨率体素,峰值检测+梯度上升定位原子坐标,OpenBabel 推断化学键和残基身份
  • 模型规模达 5B 参数,在三种模态上联合训练

实验关键数据

主实验:小分子生成(CrossDocked2020)

指标 FuncBind VoxBind(SOTA) MolCraft TargetDiff
VinaScore ↓ -5.71 -6.94 -6.59 -5.47
VinaDock ↓ -7.26 -8.30 -7.92 -7.80
QED ↑ 0.50 0.57 0.50 0.48
SA ↑ 0.65 0.70 0.69 0.58
Diversity ↑ 0.70 0.73 0.72 0.72
Strain Energy ↓ 217 162 195 1243
# Atoms 19.0 23.4 22.7 24.2

主实验:抗体 CDR 环重设计(SAbDab)

方法 H3-AAR ↑ H3-RMSD ↓ H1-AAR ↑ H1-RMSD ↓
FuncBind 47.5% 2.04 Å 86.9% 0.41 Å
AbDiffuser 34.1% 3.35 Å 76.3% 1.58 Å
DiffAb† 26.8% 3.60 Å 65.8% 1.19 Å
RAbD† 22.1% 2.90 Å 22.9% 2.26 Å

主实验:大环肽生成

方法 TS ↑ L-RMSD ↓ I-RMSD ↓ TM-Score ↑ Vina dock ↑
FuncBind 0.33 2.6 Å 1.8 Å 0.36 41%
AfCycDesign 0.34 7.6 Å 3.7 Å 0.33 29%
RFPeptide 0.31 12 Å 3.3 Å 0.33 8.8%

消融实验

配置 说明
统一模型 vs 单模态模型 性能相当,但统一模型的唯一性(uniqueness)显著更高
扩散 vs Walk-Jump Sampling 扩散在多数指标上表现更优;WJS 训练更简单、混合更快
全局嵌入 vs 空间特征图 空间特征图能更好扩展到大分子,兼容 U-Net 架构

关键发现

  • FuncBind 在 CDR 环重设计上的 AAR 和 RMSD 指标超越所有基线 1.5-3 倍
  • 湿实验验证:H3 环重设计在刚性表位上达到 45% 结合率
  • 能生成新颖且化学合理的非标准氨基酸(不到 1% 为不合理结构)
  • 大环肽基准中生成 41% 的样本 Vina 对接得分优于种子分子

亮点与洞察

  • 统一表示的威力:用神经场统一三种差异巨大的分子模态是一个优雅的设计,空间特征图的引入使其既能捕获局部精细结构,又兼容成熟的视觉网络架构
  • 用数据增强替代等变性:放弃 SE(3) 等变约束,转而使用旋转/平移增强,简化了架构设计且不影响性能
  • 湿实验闭环:在 CDR 设计上完成了从生成到实验验证的完整闭环,45% 的结合率具有实际转化价值
  • 新基准贡献:引入 ~190K 合成大环肽/蛋白复合物数据集

局限与展望

  • 小分子指标上仍略弱于 VoxBind/MolCraft 等专用模型
  • 依赖准确的分子界面 3D 结构,而此类结构在实际药物发现中获取成本高
  • 未处理可合成性(小分子)和可开发性(抗体)等实际应用约束
  • 5B 参数的训练和推理成本极高,部署门槛高
  • 跨模态迁移学习尚未深入探索

相关工作与启发

  • FuncMol: 本文直接扩展,引入空间特征图和条件生成
  • VoxBind: 体素方法的 SOTA,FuncBind 可视为其连续版本
  • AlphaFold3/RoseTTAFold: 跨模态结构预测的成功先例
  • 启发:神经场表示在分子科学中的应用潜力巨大,未来可扩展到更多生物体系

评分

  • 新颖性: ⭐⭐⭐⭐ 统一三种分子模态的神经场方法新颖,但核心技术(VAE+扩散)较成熟
  • 实验充分度: ⭐⭐⭐⭐⭐ 三模态全面评估 + 湿实验验证 + 新数据集贡献
  • 写作质量: ⭐⭐⭐⭐ 结构清晰,技术描述完整
  • 价值: ⭐⭐⭐⭐⭐ 统一分子生成框架具有重要实际意义,湿实验结果增强说服力

相关论文