Fractional Diffusion Bridge Models¶
会议: NeurIPS 2025 arXiv: 2511.01795 代码: GitHub-paired / GitHub-unpaired / SBFlow 领域: 医学图像 关键词: 扩散桥模型, 分数布朗运动, 蛋白质构象预测, 图像翻译, Schrödinger桥
一句话总结¶
提出分数扩散桥模型(FDBM),将分数布朗运动(fBM)引入生成扩散桥框架,通过 Hurst 指数 \(H\) 控制轨迹的粗糙度和长程依赖性,在蛋白质构象预测和图像翻译任务上超越布朗运动基线。
研究背景与动机¶
-
领域现状:扩散桥模型通过条件化随机过程在两个分布间构建随机插值路径,广泛用于配对/非配对数据翻译(如蛋白质构象预测、图像翻译)。现有模型统一使用标准布朗运动(BM)作为驱动噪声。
-
现有痛点:标准 BM 是马尔可夫过程,增量独立,无法捕捉真实数据中的记忆效应、长程依赖、粗糙性和反常扩散现象。对于蛋白质等复杂系统,时间上的独立增量假设可能导致建模不充分。
-
核心矛盾:现有选择 BM 的动机是数学简便性而非物理忠实性——选择更富表达力的驱动噪声应能更好地匹配真实数据动力学。
-
本文要解决什么:将分数布朗运动(非马尔可夫、具有长程相关性)引入扩散桥,同时保持可训练性和高效推理。
-
切入角度:利用 fBM 的马尔可夫近似(MA-fBM),通过 \(K\) 个 Ornstein-Uhlenbeck (OU) 过程的线性叠加来逼近 fBM,使得增广系统是马尔可夫的。
-
核心idea一句话:用 fBM 的马尔可夫近似替代 BM 驱动扩散桥,通过 Hurst 指数 \(H\) 灵活控制生成轨迹特性,在配对和非配对设置下均改善性能。
方法详解¶
整体框架¶
FDBM 的核心是将标准扩散桥中的 BM 替换为缩放的 MA-fBM \(X = \sqrt{\varepsilon}\hat{B}^H\),其中 \(\hat{B}^H_t = \sum_{k=1}^K \omega_k Y_t^k\) 是 \(K\) 个 OU 过程的加权和。参考过程 \(X\) 本身是非马尔可夫的,但增广过程 \(Z = (X, Y^1, \ldots, Y^K)\) 是马尔可夫的。
关键设计¶
1. MA-fBM 作为驱动噪声¶
Type II fBM 定义:\(B_t^H = \frac{1}{\Gamma(H+1/2)} \int_0^t (t-s)^{H-1/2} dB_s\)
- \(H > 0.5\):正相关增量(超扩散),轨迹更光滑
- \(H < 0.5\):负相关增量(亚扩散),轨迹更粗糙
- \(H = 0.5\):退化为标准 BM
MA-fBM:选择 \(K\) 个 OU 过程,速率 \(\gamma_k = r^{k-n}\),最优权重 \(\omega\) 由闭式线性系统 \(A\omega = b\) 给出,最小化 \(L^2(\mathbb{P})\) 误差。实验中固定 \(K=5\)。
2. MA-fBB(马尔可夫近似分数布朗桥)¶
对增广过程 \(Z\) 进行端点条件化,得到部分钉住的过程 \(Z_{|x_0,x_1}\),其 SDE 漂移包含可解析计算的引导项 \(u(t,z)\)。关键在于条件均值 \(\mu_{1|t}(z)\) 和条件方差 \(\sigma^2_{1|t}\) 均可闭式计算。
3. 配对数据翻译¶
Proposition 5(耦合保持性):存在一个保持训练数据耦合 \(\Pi_{0,1}\) 的随机过程 \(Z^\star\),满足 \((X_0^\star, X_1^\star) \sim \Pi_{0,1}\)。
训练目标: $\(\mathcal{L}_{\text{FDBM}}^{\text{paired}}(\theta) = \int_0^1 \mathbb{E}_{\mathbb{P}^\star}\left[\left\|\frac{X_1^\star - \mu_{1|t}(Z_t^\star)}{\sigma_{1|t}^2} - \tilde{u}^\theta(t, X_0, \mu_{1|t}(Z_t^\star))\right\|^2\right] dt\)$
关键:神经网络 \(\tilde{u}^\theta\) 的输出维度与数据维度 \(d\) 相同(不是增广维度),通过缩放变换映射到增广空间。因此 FDBM 可复用 ABM 的网络架构,额外计算开销极小。
4. 非配对数据翻译(Schrödinger桥)¶
将 SB 问题中的参考过程替换为 MA-fBM,定义增广空间上的 SB 问题,引入增广互反类和增广马尔可夫投影。采用 \(\alpha\)-IMF 训练方案(预训练 + 微调)。
损失函数/训练策略¶
- 配对:最小化神经网络预测与分数桥漂移目标之间的 \(L^2\) 距离
- 非配对:类似公式但不依赖起始值 \(X_0\),采用 forward-forward 训练策略
- 注意:非配对设置中 MA-fBM 参考过程在 \(H\) 远离 0.5 时微调阶段不稳定
实验关键数据¶
配对数据:蛋白质构象预测(D3PM 数据集)¶
| 方法 | Median RMSD(Å)↓ | Mean RMSD(Å)↓ | RMSD<2Å(%)↑ | RMSD<5Å(%)↑ | Δ RMSD Mean↑ |
|---|---|---|---|---|---|
| SBALIGN | 3.67 | 4.82 | 0% | 71% | 1.92 |
| Sesame | 2.87 | 3.65 | 38% | 82% | 3.11 |
| ABM (baseline) | 2.40 | 3.49 | 43% | 84% | 3.35 |
| FDBM (H=0.2) | 2.12 | 3.34 | 48% | 86% | 3.39 |
| FDBM (H=0.3) | 2.33 | 3.42 | 43% | 85% | 3.49 |
| FDBM (H=0.1) | 2.20 | 3.44 | 46% | 83% | 3.45 |
非配对数据:AFHQ 图像翻译¶
在 AFHQ-256 和 AFHQ-512 上评估 cat↔wild 翻译:
| 方法/设置 | FID (wild→cat)↓ | FID (cat→wild)↓ |
|---|---|---|
| SBFlow (AFHQ-256) | 基线 | 基线 |
| FDBM (H=0.6, AFHQ-256) | 19.42 | 11.62 |
| FDBM (H=0.4, AFHQ-512) | 30.11 | 14.27 |
合成数据:Moons & T-Shape¶
| 数据集 | ABM WSD | FDBM 最优 WSD |
|---|---|---|
| Moons | 0.015±0.019 | 0.012±0.002 (H=0.7) |
| T-Shape | 0.082±0.028 | 0.048±0.039 (H=0.2) |
消融实验¶
- H 的选择依赖任务:Moons 适合平滑轨迹(H=0.6-0.7),T-Shape 和蛋白质适合粗糙轨迹(H=0.1-0.3)
- K=5 个 OU 过程已足够,增加 K 改善有限
- 扩散系数 \(\sqrt{\varepsilon}\):蛋白质任务最优为 0.2
关键发现¶
- 粗糙轨迹(H<0.5)在蛋白质预测中更优:RMSD<2Å 比例从 ABM 的 43% 提升到 48%,中位 RMSD 从 2.40Å 降至 2.12Å
- ABM 已是很强的基线,优于此前所有方法(SBALIGN、Sesame)
- FDBM 保持耦合(Proposition 5),与 SBALIGN 不同
- 非配对设置中 H 远离 0.5 时微调不稳定,表明 fBM SB 问题存在前向-后向不对称挑战
- 计算开销极小:FDBM 相比 ABM 仅增加了 MA-fBM 的输入/输出变换
亮点与洞察¶
- 将 fBM 引入扩散桥建模的首次工作,概念上优雅:BM 只是 \(H=0.5\) 的特例,现在可以调节 \(H\) 来匹配数据特性
- 耦合保持性的理论证明(Proposition 5)是重要的理论贡献
- 实验发现蛋白质构象变化适合粗糙轨迹,暗示分子运动的记忆效应
- 架构复用设计精巧:神经网络维度不变,仅通过缩放映射,最小化实现复杂度
- Moons 用光滑 H,T-Shape 用粗糙 H的发现表明最优 \(H\) 的选择有可解释的结构
局限性/可改进方向¶
- 非配对设置中 H 远离 0.5 不稳定:SB 微调不收敛,限制了 FDBM 在非配对任务中的灵活性
- \(H\) 需要手动搜索:目前没有自动选择 \(H\) 的方法,可考虑将其作为可学习参数
- MA-fBM 是近似:\(K=5\) 的近似精度有限,可能在某些场景下不够
- 缺乏自适应 H:不同区域可能需要不同的 \(H\),全局固定可能次优
- 蛋白质实验仅在 D3PM 子集上:需更大规模验证
相关工作与启发¶
- 建立在 ABM (Bortoli et al.)、SBFlow (Bortoli et al.)、SBALIGN (Somnath et al.) 基础上
- MA-fBM 技术来自 Harms & Stefanovits 和 Daems et al.
- 核心启发:选择驱动噪声的统计特性(记忆、粗糙度)应匹配目标数据的物理特性,而非仅追求数学方便
评分¶
⭐⭐⭐⭐ (4/5)
理由:概念新颖(首次将 fBM 引入扩散桥),理论扎实(耦合保持证明),实验全面(合成+蛋白质+图像),蛋白质任务上的提升有意义。非配对设置的不稳定性是明确的局限。