Manipulating 3D Molecules in a Fixed-Dimensional E(3)-Equivariant Latent Space¶
会议: NeurIPS 2025
arXiv: 2506.00771
代码: GitHub
领域: 医学图像
关键词: 分子生成, VAE, E(3)等变性, 潜在空间操作, 贝叶斯流网络
一句话总结¶
提出MolFLAE,一种学习固定维度、E(3)等变潜在空间的3D分子变分自编码器,通过引入可学习虚拟节点和贝叶斯流网络解码器,实现零样本分子编辑,包括原子数编辑、结构重构和性质插值,并在人类糖皮质激素受体(hGR)的药物优化中展示了实际应用价值。
研究背景与动机¶
药物化学家在优化药物时经常需要考虑分子的3D结构,设计结构不同但保留关键特征(如形状、药效团、化学性质)的分子。现有深度学习方法将3D分子编辑分解为一系列狭义的子任务(如分子修补、性质导向优化),通常依赖任务特定的监督和架构,灵活性和泛化能力有限。
核心挑战在于:3D分子具有可变的原子数、对原子排列的置换不变性和对空间旋转/平移的SE(3)等变性。大多数现有3D生成模型在每个原子或功能团的乘积空间上操作,导致潜在表示维度可变——这直接阻止了向量级别的插值、外推等常见操作,使零样本分子编辑不可行或极其困难。
受图像领域潜在空间导航成功案例的启发(如风格迁移、图像编辑),作者认为如果能为3D分子建立一个固定维度、结构良好的潜在空间,就能实现灵活的零样本分子操作。
方法详解¶
整体框架¶
MolFLAE是一个VAE架构:编码器将可变大小的3D分子映射到固定维度的E(3)等变潜在空间;解码器使用贝叶斯流网络(BFN)从潜在编码重构完整分子结构。训练目标为:
关键设计¶
- 可学习虚拟节点编码器: 核心创新是在分子点云后附加 \(N_Z\) 个可学习虚拟节点(设为10,以确保在3D空间中形成非退化单纯形来编码手性信息),与真实原子一起通过E(3)等变神经网络联合更新。更新完成后,丢弃真实原子的嵌入,仅保留虚拟节点的嵌入作为固定长度的潜在编码:
$\((\_ , [\mathbf{z}_x, \mathbf{z}_h]) = \boldsymbol{\phi}_\theta([\mathbf{x}_M, \mathbf{v}_M], [\mathbf{x}_Z, \mathbf{v}_Z])\)$
其中 \(\mathbf{z}_x \in \mathbb{R}^{N_Z \times 3}\) 是E(3)等变的空间分量,\(\mathbf{z}_h \in \mathbb{R}^{N_Z \times D_f}\) 是E(3)不变的特征分量。这种设计使得空间和语义特征能部分解耦——\(\mathbf{z}_x\) 编码形状和朝向,\(\mathbf{z}_h\) 编码子结构组成。
- VAE正则化: 对潜在空间施加KL散度正则化以确保平滑和连续:
$\(\mathcal{L}_{\text{reg}} = \text{KL}\left(\mathcal{N}([\boldsymbol{\mu}_x, \boldsymbol{\mu}_h], [\boldsymbol{\sigma}_x^2, \boldsymbol{\sigma}_h^2]) \| \mathcal{N}([0,0], [\text{var}_x, \text{var}_h]\mathbf{I})\right)\)$
其中 \(\boldsymbol{\mu}_x = \mathbf{z}_x\),\([\boldsymbol{\sigma}_x^2, \boldsymbol{\mu}_h, \boldsymbol{\sigma}_h^2] = \text{Linear}(\mathbf{z}_h)\)。这鼓励潜在空间的平滑性,便于分子间的插值。
- 贝叶斯流网络(BFN)解码器: 选择BFN作为解码器的动因是它能统一处理连续数据(原子坐标,高斯分布)和离散数据(原子类型,分类分布)。对坐标使用高斯发送分布 \(p_S(\mathbf{y}^x | \mathbf{x}_M; \alpha) = \mathcal{N}(\mathbf{y}^x | \mathbf{x}_M, \alpha^{-1}\mathbf{I})\),对原子类型使用经变换的分类发送分布。重构损失为坐标损失和原子类型损失之和:\(\mathcal{L}_{\text{recon}} = \mathcal{L}_x^n + \mathcal{L}_v^n\)。
损失函数 / 训练策略¶
- 训练数据集:QM9(134K小分子,≤9重原子)、GEOM-Drugs(430K药物分子)、ZINC-9M(930万分子)
- QM9和GEOM-Drugs显式处理氢原子,ZINC-9M隐式处理
- 从训练集的原子数先验中采样来控制生成的原子数
实验关键数据¶
主实验:无条件3D分子生成¶
| 方法 | QM9 Atom Sta(%) | QM9 Mol Sta(%) | QM9 Valid(%) | GEOM Valid(%) |
|---|---|---|---|---|
| EDM | 98.7 | 82.0 | 91.9 | 92.6 |
| GEOLDM | 98.9 | 89.4 | 93.8 | 99.3 |
| GEOBFN 100 | 98.6 | 87.2 | 93.0 | 93.1 |
| UniGEM | 99.0 | 89.8 | 95.0 | 98.4 |
| MolFLAE 100 | 99.4 | 92.0 | 96.8 | 99.7 |
MolFLAE在原子稳定性、分子稳定性和有效性上均达到竞争力最佳水平。
消融实验:潜在空间解耦验证¶
| 设置 | MACCS Sim (子结构) | Shape Sim (形状) | Valid(%) |
|---|---|---|---|
| 保留 \(\mathbf{z}_x\) | 0.421 ↓ | 0.394 ↑ | 100.0 |
| 保留 \(\mathbf{z}_h\) | 0.580 ↑ | 0.174 ↓ | 100.0 |
保留 \(\mathbf{z}_x\) 时形状相似度显著高于保留 \(\mathbf{z}_h\)(0.394 vs 0.174),反之MACCS指纹相似度更高(0.580 vs 0.421),证实了空间-语义的部分解耦。
分子类似物生成(原子数变化)¶
| 原子数变化 | MCS-IoU相似度 | Valid(%) | Atom Sta(%) |
|---|---|---|---|
| -2 | 69.79 | 100.0 | 84.58 |
| -1 | 76.69 | 99.89 | 83.28 |
| 0 | 84.08 | 99.76 | 82.48 |
| +1 | 76.05 | 99.89 | 82.38 |
| +2 | 69.95 | 99.68 | 82.53 |
关键发现¶
- 潜在空间插值产生的中间分子保持高有效性(>99.8%),且物理/结构性质呈现显著的线性变化趋势(Pearson \(r > 0.9\))
- hGR药物优化案例:90% AZD2906 + 10% BI-653048的潜在空间混合,100个候选中top-10在对接分数上优于BI-653048,8/10在亲水性上优于AZD2906
- Sample 34保留了两个已知活性分子的关键药效团,对接姿态与生成构象RMSD仅1.35 Å
亮点与洞察¶
- 固定维度+等变性的潜在空间设计解决了3D分子编辑的根本难题——可变维度阻止向量操作
- 虚拟节点概念巧妙:类似NLP中的[CLS] token思想,在3D分子中实现了信息压缩
- 空间-语义部分解耦是一个自发涌现的性质,无需额外监督
- hGR药物优化案例令人信服地展示了方法的实际药物设计价值
局限与展望¶
- 潜在空间的解耦性仍是"部分"的,更好的解耦可能需要对分子构象变化施加不变性约束
- 当前仅验证了小分子(QM9 ≤9重原子),对蛋白质等大分子的扩展性未验证
- BFN解码器的采样效率相比自回归方法虽有优势,但仍较慢
- 未与其他固定维度潜在空间方法(如UAE-3D)进行直接的编辑任务对比
相关工作与启发¶
- 与EDM、GEOBFN等扩散模型不同,MolFLAE通过VAE的潜在空间实现编辑而非仅生成
- 虚拟节点编码思路可启发其他需要固定维度表示的结构化数据(如蛋白质、材料晶体)
- BFN作为解码器的混合连续-离散建模能力可推广至其他分子类型的生成
评分¶
- 新颖性: ⭐⭐⭐⭐⭐ 固定维度E(3)等变潜在空间+虚拟节点+BFN的组合在3D分子领域首创
- 实验充分度: ⭐⭐⭐⭐ 覆盖无条件生成、类似物设计、重构、插值和药物优化,但缺少与同类方法的直接编辑对比
- 写作质量: ⭐⭐⭐⭐ 数学推导清晰,可视化丰富,但部分实验细节在附录中
- 价值: ⭐⭐⭐⭐⭐ 为3D分子编辑提供了通用、灵活的框架,对药物发现有直接应用前景
相关论文¶
- [NeurIPS 2025] Towards Unified and Lossless Latent Space for 3D Molecular Latent Diffusion Modeling
- [NeurIPS 2025] Pharmacophore-Guided Generative Design of Novel Drug-Like Molecules
- [NeurIPS 2025] Generating Multi-Table Time Series EHR from Latent Space with Minimal Preprocessing
- [ICML 2025] Scalable Non-Equivariant 3D Molecule Generation via Rotational Alignment
- [ICCV 2025] Controllable Latent Space Augmentation for Digital Pathology