Diversity By Design: Leveraging Distribution Matching for Offline Model-Based Optimization¶

会议: ICML 2025
arXiv: 2501.18768
代码: 无
领域: 机器学习优化
关键词: 离线优化, 模型基础优化, 设计多样性, 分布匹配, 对抗训练

一句话总结¶

提出 DynAMO，通过将设计多样性显式建模为分布匹配问题，在离线模型基础优化（MBO）中同时发现高质量和高多样性的候选设计方案。

领域现状：离线模型基础优化（MBO）给定一个离线数据集，目标是提出最大化目标函数的新设计。常用于蛋白质设计、分子优化等科学领域。现有方法主要聚焦于最大化目标值，不关注候选方案的多样性。

现有痛点：(1) 生成的候选设计往往集中在目标函数的单一峰值附近，缺乏多样性——但实际应用中需要多个不同的近优方案供选择；(2) 离线数据集本身包含丰富的多样性信息，但现有方法未加利用；(3) 简单的多样性正则化（如分散约束）往往与质量目标冲突，导致性能下降。

核心矛盾：需要同时优化设计质量（高目标值）和设计多样性（覆盖多种最优配置），但两者之间存在天然的张力。

本文目标：将多样性作为显式目标引入任意 MBO 问题，同时保持设计质量。

切入角度：将多样性形式化为分布匹配问题——生成设计的分布应该捕获离线数据集中固有的多样性结构。

核心 idea：用对抗训练的分布匹配损失约束生成设计的分布与离线数据集的高质量子集分布对齐，从而在优化质量的同时保持多样性。DynAMO 可作为插件与任何 MBO 方法结合。

在任何 MBO 方法的优化管线中，额外添加一个对抗分布匹配项。从离线数据集中提取高质量子集作为多样性参考分布，然后用对抗训练使生成设计的分布与之匹配。

分布匹配作为多样性目标:
- 功能：将设计多样性形式化为可优化的目标
- 核心思路：将离线数据集中高目标值样本的分布作为参考，用对抗判别器度量生成设计分布与参考分布之间的距离。最小化该距离确保生成设计不仅质量高，还保持了数据集中本身蕴含的多样性结构
- 设计动机：离线数据集的多样性是领域知识的隐式编码（如蛋白质空间中的不同功能族），保持这种多样性比随机分散更有意义
对抗优化框架 (DynAMO):
- 功能：将分布匹配项以插件形式加入任意 MBO 方法
- 核心思路：训练一个判别器区分"来自优化器的生成设计"和"来自数据集高质量子集的真实设计"，将判别器损失加入优化器的总目标中。任何 MBO 方法（CbAS、COMsb、ROMA 等）都可以添加 DynAMO 项
- 设计动机：对抗训练天然适合分布匹配，且作为附加损失项不改变原方法的核心优化流程
高质量子集选择:
- 功能：确定多样性参考分布
- 核心思路：根据代理模型或已知目标值筛选离线数据集中的 top-k 样本作为参考分布
- 设计动机：不是与整个数据集匹配（包含低质量样本），而是只与高质量子集匹配——确保多样性在"好的设计空间"内

总损失 = 原始 MBO 目标 + λ × 对抗分布匹配损失。判别器和生成器交替训练。

领域	MBO 方法 + DynAMO	质量变化	多样性变化
蛋白质设计	提升	保持/轻微提升	显著提升
分子优化	提升	保持	显著提升
材料设计	提升	保持	显著提升