PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion¶
会议: ICML 2025
arXiv: 2412.17780
代码: https://huggingface.co/ChatterjeeLab/PepTune (有)
领域: Image Generation (Peptide/Drug Design)
关键词: 治疗性肽设计, 离散扩散, 多目标优化, MCTS, SMILES
一句话总结¶
PepTune 结合 Masked Discrete Language Model (MDLM) 和蒙特卡罗树搜索 (MCTS) 多目标引导策略,在离散肽 SMILES 空间中同时优化多种治疗属性(结合亲和力、溶解性、膜通透性等),生成含非天然氨基酸和环化修饰的从头设计肽药物。
研究背景与动机¶
领域现状:肽疗法(如 GLP-1 受体激动剂 semaglutide/liraglutide)在糖尿病、肥胖等疾病治疗中取得里程碑式成功。肽能结合多样的蛋白表面、打断蛋白-蛋白相互作用,自 2000 年以来已有 33 种 FDA 批准的治疗性肽。
现有痛点:设计同时满足多个冲突目标(如结合亲和力、溶解性、膜通透性)的肽是重大挑战。现有方法限于(1)连续空间、(2)无条件生成、(3)单目标引导。传统方法依赖筛选 10^12 量级的随机组合文库。
核心矛盾:治疗性肽需要含非天然氨基酸(nAAs)和环化修饰(提高稳定性和通透性),但现有深度学习模型只能处理 20 种标准氨基酸;同时,多目标引导在离散空间极为困难——梯度无法直接计算。
本文目标:构建一个能在离散肽 SMILES 空间中进行多目标条件生成的扩散模型。
切入角度:(1)用 SMILES 而非氨基酸序列表示肽→支持 nAAs 和环化;(2)用 MCTS 而非梯度引导→解决离散空间引导难题。
核心 idea:MDLM 负责探索离散肽空间的有效结构,MCTS 负责引导生成向多个治疗目标的 Pareto 最优方向演化。
方法详解¶
整体框架¶
- 输入:目标蛋白序列 + 待优化的治疗属性列表
- 第一阶段:在 1100 万条肽 SMILES 上预训练 PepMDLM(无条件生成器)
- 第二阶段:用属性分类器引导的 MCTS 策略对生成过程进行多目标条件引导
- 输出:一组 Pareto 最优的肽 SMILES + 各项属性分数
关键设计¶
-
状态依赖的 Masking Schedule:
- 核心洞察:肽键(peptide bond)是所有有效肽的基础结构
- 设计多项式masking schedule:\(\alpha_t(\mathbf{x}_0) = 1 - t^w\) 对肽键token,\(\alpha_t = 1 - t\) 对非肽键token
- 肽键token在前向过程中被更晚mask,在逆过程中被更早unmask
- 训练损失中肽键token权重放大 \(w\) 倍:\(\frac{w}{t} \log \langle \mathbf{x}_0, \mathbf{x}_\theta \rangle\)
- 为什么:肽的绝大多数 SMILES 不是有效肽——让模型先"搭好骨架"再填充侧链
-
全局序列无效性损失 (Invalid Loss):
- 对预测概率取 argmax 得到离散序列,检查是否为有效肽
- 无效序列通过 softmax 概率加权的惩罚传播梯度
- \(\mathcal{L}_{\text{invalid}} = \sum_\ell \text{SM}(x_{\theta,k}^{(\ell)}) \cdot \mathbf{1}[\tilde{\mathbf{x}}_0 \text{ is Invalid}]\)
- 为什么:argmax 不可微,用 softmax 概率作为 surrogate 来绕过
-
MCTS 多目标引导:
- Selection:从根节点(全mask)开始,根据累积奖励选择非支配的子节点路径
- Expansion:用 Gumbel noise 采样 \(M\) 个不同的 unmask 方案
- Rollout:贪心 unmask 到完整序列,用分类器计算 \(K\) 个目标的分数
- Backpropagation:奖励向量回传更新路径上所有节点
- 奖励定义:\(r_k(\mathbf{x}) = \frac{1}{|\mathcal{P}^*|} \sum_n \mathbb{I}[s_k(\mathbf{x}) \geq s_k(\tilde{\mathbf{x}}_n)]\)(击败 Pareto 集中的比例)
- 无效肽惩罚:从所有维度扣减与无效比例成正比的分数
- 为什么:离散空间无梯度,MCTS 通过搜索+奖励信号实现不依赖梯度的多目标引导
损失函数 / 训练策略¶
- 总损失:\(\mathcal{L} = \mathcal{L}_{\text{NELBO}}^\infty + \mathcal{L}_{\text{invalid}}\)
- RoFormer 骨架:8层,768 隐藏维度,8 注意力头
- 训练数据:1100 万肽 SMILES(SmProt + CycloPs 合成数据)
- PeptideCLM SPE 分词:581 tokens,平均 4 字符/token
- 8×A6000 GPU,1600 GPU 小时,AdamW,lr=3e-4
- MCTS:128 iterations,50 children/expansion
实验关键数据¶
主实验¶
| 目标蛋白 | 属性 | 最佳 Docking Score | 对照 |
|---|---|---|---|
| TfR (血脑屏障) | 结合+溶解+非溶血 | -8.4 kcal/mol | T7肽: -8.4(但PepTune更短) |
| GLP-1R (糖尿病) | 结合+溶解+非溶血 | -7.4 kcal/mol | semaglutide: -5.7 (更长) |
| GFAP (亚历山大病) | 结合+通透+溶解+非溶血 | -8.5 kcal/mol | 无已知肽 binder |
| TfR+GLAST (双靶) | 双靶结合+溶解 | TfR:-10.5, GLAST:-9.2 | 首次双靶肽设计 |
消融实验¶
| 配置 | Validity↑ | Diversity | 说明 |
|---|---|---|---|
| PepMDLM (无引导) | 45% (len=100) | 0.705 | 基线无条件 |
| PepTune (MCTS引导) | 100% (after 20 iter) | 0.677 | MCTS 提升有效性到100% |
| HELM-GPT (对照) | 83.9% | 0.595 | HELM 表示,不支持 nAAs |
| 无 state-dependent mask | ~30% | - | 有效性显著下降 |
| 无 invalid loss | ~35% | - | 有效性有下降 |
关键发现¶
- MCTS 引导在 20 迭代后即达到 100% 有效肽生成率
- 生成的肽含丰富的非天然氨基酸(平均 2.94/肽)和环化结构
- 多目标引导不显著牺牲多样性(相比无条件生成仅差 0.03)
- 双靶 peptide 实验证明 PepTune 可同时优化对两个蛋白的结合亲和力
- GLP-1R binder docking 分数优于 semaglutide,且序列更短
亮点与洞察¶
- 首个离散空间多目标引导扩散:MCTS + masked diffusion 的组合是对该领域的重要贡献
- SMILES 表示的优势:支持 nAAs 和环化,大幅扩展了可设计的肽空间
- 状态依赖 masking 的物理直觉:先骨架后侧链的生成顺序与化学直觉一致
- 临床相关性:多个真实治疗靶点的案例研究,有下游实验验证前景
局限与展望¶
- 依赖合成肽数据(CycloPs),稀有 nAAs 可能增加合成难度和成本
- 属性分类器的质量是瓶颈——膜通透性等属性缺乏外部验证
- MCTS 采样速度较慢(128 迭代 × 50 children × rollout)
- 尚无湿实验验证(仅计算 docking)
相关工作与启发¶
- MDLM (Sahoo et al.) 提供了 masked discrete diffusion 的基础
- RFpeptides 等结构基础模型需要目标 3D 结构,PepTune 只需序列
- 启发:MCTS 引导策略可扩展到蛋白质设计、DNA 序列优化等其他离散生物序列生成
评分¶
- 新颖性: ⭐⭐⭐⭐⭐ MCTS + 离散扩散 + 肽 SMILES 的组合非常创新
- 实验充分度: ⭐⭐⭐⭐⭐ 5 个单靶 + 2 个双靶案例,详细消融
- 写作质量: ⭐⭐⭐⭐ 内容丰富,但篇幅较长
- 价值: ⭐⭐⭐⭐⭐ 对药物设计有重要实际价值
相关论文¶
- [ECCV 2024] M2D2M: Multi-Motion Generation from Text with Discrete Diffusion Models
- [ICML 2025] Simple and Critical Iterative Denoising: A Recasting of Discrete Diffusion in Graph Generation
- [ICML 2025] Distillation of Discrete Diffusion through Dimensional Correlations (Di4C)
- [ICLR 2026] Pareto-Conditioned Diffusion Models for Offline Multi-Objective Optimization
- [ICLR 2026] MAC-AMP: A Closed-Loop Multi-Agent Collaboration System for Multi-Objective Antimicrobial Peptide Design