跳转至

Manipulating 3D Molecules in a Fixed-Dimensional E(3)-Equivariant Latent Space

会议: NeurIPS 2025
arXiv: 2506.00771
代码: GitHub
领域: 医学图像
关键词: 分子生成, VAE, E(3)等变性, 潜在空间操作, 贝叶斯流网络

一句话总结

提出MolFLAE,一种学习固定维度、E(3)等变潜在空间的3D分子变分自编码器,通过引入可学习虚拟节点和贝叶斯流网络解码器,实现零样本分子编辑,包括原子数编辑、结构重构和性质插值,并在人类糖皮质激素受体(hGR)的药物优化中展示了实际应用价值。

研究背景与动机

药物化学家在优化药物时经常需要考虑分子的3D结构,设计结构不同但保留关键特征(如形状、药效团、化学性质)的分子。现有深度学习方法将3D分子编辑分解为一系列狭义的子任务(如分子修补、性质导向优化),通常依赖任务特定的监督和架构,灵活性和泛化能力有限。

核心挑战在于:3D分子具有可变的原子数、对原子排列的置换不变性和对空间旋转/平移的SE(3)等变性。大多数现有3D生成模型在每个原子或功能团的乘积空间上操作,导致潜在表示维度可变——这直接阻止了向量级别的插值、外推等常见操作,使零样本分子编辑不可行或极其困难。

受图像领域潜在空间导航成功案例的启发(如风格迁移、图像编辑),作者认为如果能为3D分子建立一个固定维度、结构良好的潜在空间,就能实现灵活的零样本分子操作。

方法详解

整体框架

MolFLAE是一个VAE架构:编码器将可变大小的3D分子映射到固定维度的E(3)等变潜在空间;解码器使用贝叶斯流网络(BFN)从潜在编码重构完整分子结构。训练目标为:

\[\mathcal{L} = \mathcal{L}_{\text{recon}} + \mathcal{L}_{\text{reg}}\]

关键设计

  1. 可学习虚拟节点编码器: 核心创新是在分子点云后附加 \(N_Z\) 个可学习虚拟节点(设为10,以确保在3D空间中形成非退化单纯形来编码手性信息),与真实原子一起通过E(3)等变神经网络联合更新。更新完成后,丢弃真实原子的嵌入,仅保留虚拟节点的嵌入作为固定长度的潜在编码:

$\((\_ , [\mathbf{z}_x, \mathbf{z}_h]) = \boldsymbol{\phi}_\theta([\mathbf{x}_M, \mathbf{v}_M], [\mathbf{x}_Z, \mathbf{v}_Z])\)$

其中 \(\mathbf{z}_x \in \mathbb{R}^{N_Z \times 3}\) 是E(3)等变的空间分量,\(\mathbf{z}_h \in \mathbb{R}^{N_Z \times D_f}\) 是E(3)不变的特征分量。这种设计使得空间和语义特征能部分解耦——\(\mathbf{z}_x\) 编码形状和朝向,\(\mathbf{z}_h\) 编码子结构组成。

  1. VAE正则化: 对潜在空间施加KL散度正则化以确保平滑和连续:

$\(\mathcal{L}_{\text{reg}} = \text{KL}\left(\mathcal{N}([\boldsymbol{\mu}_x, \boldsymbol{\mu}_h], [\boldsymbol{\sigma}_x^2, \boldsymbol{\sigma}_h^2]) \| \mathcal{N}([0,0], [\text{var}_x, \text{var}_h]\mathbf{I})\right)\)$

其中 \(\boldsymbol{\mu}_x = \mathbf{z}_x\)\([\boldsymbol{\sigma}_x^2, \boldsymbol{\mu}_h, \boldsymbol{\sigma}_h^2] = \text{Linear}(\mathbf{z}_h)\)。这鼓励潜在空间的平滑性,便于分子间的插值。

  1. 贝叶斯流网络(BFN)解码器: 选择BFN作为解码器的动因是它能统一处理连续数据(原子坐标,高斯分布)和离散数据(原子类型,分类分布)。对坐标使用高斯发送分布 \(p_S(\mathbf{y}^x | \mathbf{x}_M; \alpha) = \mathcal{N}(\mathbf{y}^x | \mathbf{x}_M, \alpha^{-1}\mathbf{I})\),对原子类型使用经变换的分类发送分布。重构损失为坐标损失和原子类型损失之和:\(\mathcal{L}_{\text{recon}} = \mathcal{L}_x^n + \mathcal{L}_v^n\)

损失函数 / 训练策略

  • 训练数据集:QM9(134K小分子,≤9重原子)、GEOM-Drugs(430K药物分子)、ZINC-9M(930万分子)
  • QM9和GEOM-Drugs显式处理氢原子,ZINC-9M隐式处理
  • 从训练集的原子数先验中采样来控制生成的原子数

实验关键数据

主实验:无条件3D分子生成

方法 QM9 Atom Sta(%) QM9 Mol Sta(%) QM9 Valid(%) GEOM Valid(%)
EDM 98.7 82.0 91.9 92.6
GEOLDM 98.9 89.4 93.8 99.3
GEOBFN 100 98.6 87.2 93.0 93.1
UniGEM 99.0 89.8 95.0 98.4
MolFLAE 100 99.4 92.0 96.8 99.7

MolFLAE在原子稳定性、分子稳定性和有效性上均达到竞争力最佳水平。

消融实验:潜在空间解耦验证

设置 MACCS Sim (子结构) Shape Sim (形状) Valid(%)
保留 \(\mathbf{z}_x\) 0.421 ↓ 0.394 100.0
保留 \(\mathbf{z}_h\) 0.580 0.174 ↓ 100.0

保留 \(\mathbf{z}_x\) 时形状相似度显著高于保留 \(\mathbf{z}_h\)(0.394 vs 0.174),反之MACCS指纹相似度更高(0.580 vs 0.421),证实了空间-语义的部分解耦。

分子类似物生成(原子数变化)

原子数变化 MCS-IoU相似度 Valid(%) Atom Sta(%)
-2 69.79 100.0 84.58
-1 76.69 99.89 83.28
0 84.08 99.76 82.48
+1 76.05 99.89 82.38
+2 69.95 99.68 82.53

关键发现

  • 潜在空间插值产生的中间分子保持高有效性(>99.8%),且物理/结构性质呈现显著的线性变化趋势(Pearson \(r > 0.9\)
  • hGR药物优化案例:90% AZD2906 + 10% BI-653048的潜在空间混合,100个候选中top-10在对接分数上优于BI-653048,8/10在亲水性上优于AZD2906
  • Sample 34保留了两个已知活性分子的关键药效团,对接姿态与生成构象RMSD仅1.35 Å

亮点与洞察

  • 固定维度+等变性的潜在空间设计解决了3D分子编辑的根本难题——可变维度阻止向量操作
  • 虚拟节点概念巧妙:类似NLP中的[CLS] token思想,在3D分子中实现了信息压缩
  • 空间-语义部分解耦是一个自发涌现的性质,无需额外监督
  • hGR药物优化案例令人信服地展示了方法的实际药物设计价值

局限与展望

  • 潜在空间的解耦性仍是"部分"的,更好的解耦可能需要对分子构象变化施加不变性约束
  • 当前仅验证了小分子(QM9 ≤9重原子),对蛋白质等大分子的扩展性未验证
  • BFN解码器的采样效率相比自回归方法虽有优势,但仍较慢
  • 未与其他固定维度潜在空间方法(如UAE-3D)进行直接的编辑任务对比

相关工作与启发

  • 与EDM、GEOBFN等扩散模型不同,MolFLAE通过VAE的潜在空间实现编辑而非仅生成
  • 虚拟节点编码思路可启发其他需要固定维度表示的结构化数据(如蛋白质、材料晶体)
  • BFN作为解码器的混合连续-离散建模能力可推广至其他分子类型的生成

评分

  • 新颖性: ⭐⭐⭐⭐⭐ 固定维度E(3)等变潜在空间+虚拟节点+BFN的组合在3D分子领域首创
  • 实验充分度: ⭐⭐⭐⭐ 覆盖无条件生成、类似物设计、重构、插值和药物优化,但缺少与同类方法的直接编辑对比
  • 写作质量: ⭐⭐⭐⭐ 数学推导清晰,可视化丰富,但部分实验细节在附录中
  • 价值: ⭐⭐⭐⭐⭐ 为3D分子编辑提供了通用、灵活的框架,对药物发现有直接应用前景

相关论文