Integration Matters for Learning PDEs with Backward SDEs¶

会议: NeurIPS 2025
arXiv: 2505.01078
代码: https://github.com/sungje-park/heunbsde
领域: 科学计算 / PDE求解
关键词: BSDE, PDE求解, Stratonovich积分, Heun方法, 离散化偏差

一句话总结¶

揭示了标准 BSDE 方法性能不如 PINNs 的根本原因是 Euler-Maruyama 积分引入的不可消除离散化偏差，提出基于 Stratonovich 形式的 Heun-BSDE 方法彻底消除该偏差，在高维 PDE 上与 PINNs 竞争。

研究背景与动机¶

领域现状：求解高维 PDE 有两大深度学习方法——PINNs（直接最小化 PDE 残差）和 BSDE 方法（将 PDE 重写为前向-后向 SDE 并模拟轨迹）。BSDE 方法在随机最优控制等有底层动力学的问题中有天然优势。
现有痛点：经验上 BSDE 方法显著不如 PINNs，但原因不明。先前工作 [33] 提出混合插值损失来弥补，但引入了需要调参的超参数，且未解释根本原因。
核心矛盾：标准 BSDE 使用 Euler-Maruyama (EM) 积分离散化一步自一致损失时，会产生与步长 \(\tau\) 无关的不可消除偏差项 \(\text{Bias}(\theta) = \frac{1}{2T}\int_0^T \mathbb{E}\text{tr}((H \cdot \nabla^2 u_\theta)^2)dt\)，使得优化目标偏离真实解。
本文要解决什么？ (1) 揭示 BSDE vs PINNs 性能差距的根因；(2) 提出无偏差的积分方案。
切入角度：将 BSDE 解释为 Stratonovich SDE（而非 Itô SDE），使用随机 Heun 积分（收敛到 Stratonovich 解），从而消除偏差。
核心idea一句话：用 Stratonovich + Heun 积分替代 Itô + EM 积分，消除 BSDE 损失中的离散化偏差。

方法详解¶

整体框架¶

将求解 PDE 的 forward-backward SDE 系统用 Stratonovich 形式重写，用随机 Heun 方法离散化（两步预测-校正格式），构建无偏的一步自一致损失函数。

关键设计¶

偏差分析（Theorem 4.2）:
做什么：理论证明 EM 一步损失的偏差不可消除
核心思路：\(\tau^{-2} \cdot \ell_{\text{EM},\tau}(\theta,x,t) = (R[u_\theta])^2 + \frac{1}{2}\text{tr}((H \cdot \nabla^2 u_\theta)^2) + O(\tau^{1/2})\)，其中第二项是与 \(\tau\) 无关的偏差——即使 \(\tau \to 0\) 也无法消除
设计动机：解释了为什么缩小步长也无法改善 EM-BSDE
Stratonovich-Heun BSDE 损失（Theorem 4.4）:
做什么：提出无偏的损失函数
核心思路：\(L_{\text{Heun},\tau}(\theta) = \frac{1}{T}\int_0^T \mathbb{E}[(R[u_\theta])^2]dt + O(\tau^{1/2})\)——偏差项仅为 \(O(\tau^{1/2})\)，可通过减小步长消除
设计动机：Heun 方法是二阶精度的预测-校正格式，自然收敛到 Stratonovich 解
高效子采样实现:
做什么：加速训练
核心思路：先完整 rollout 前向 SDE 轨迹（stop gradient），然后随机子采样 \(B\) 个时间步计算损失，而非使用全部 \(N\) 步
设计动机：减少每步计算量，同时保持性能

训练策略¶

Heun 离散化需要额外一次函数评估（预测步+校正步），但允许使用更大步长
一步损失 (\(k=1\)) 即可，无需多步损失的超参数调节

实验关键数据¶

主实验（100D PDE, 一步损失）¶

PDE	PINNs	FS-PINNs	EM-BSDE	Heun-BSDE
100D HJB	0.1260	0.0737	0.3626	0.0493
100D BSB	1.5066	0.0497	0.3735	0.0535
10D BZ	3.8566	0.0351	0.1903	0.0228

消融实验（不同步数 \(k\)）¶

步数 \(k\)	EM-BSDE (100D HJB)	Heun-BSDE (100D HJB)
\(k=1\)	0.3626	0.0493
\(k=5\)	0.2117	0.0640
\(k=50\)	0.0858	0.0601

关键发现¶

EM-BSDE 的偏差确实是性能差距的根因：在所有实验中 EM-BSDE 都大幅劣于 Heun-BSDE
Heun-BSDE 与 PINNs 竞争：在 HJB 和 BZ 上超过 PINNs，在 BSB 上接近
EM-BSDE 需要多步才能缓解偏差，但多步又带来优化困难；Heun-BSDE 一步即可
子采样实现几乎不损性能，但大幅加快训练

亮点与洞察¶

一个被忽视的算法细节决定了整个方法的成败：积分方案的选择（EM vs Heun）从未在 BSDE 文献中被认真研究，但它是性能差距的根因。这提醒我们计算实现细节可能比方法论创新更关键。
理论驱动的算法改进：通过精确的偏差分析（而非经验试错）找到问题并设计解决方案，理论和实验完美吻合。
Stratonovich vs Itô 的选择在数值实现中的重要性：虽然两种形式在连续极限下等价，但离散化时 Stratonovich 形式对数值方法更友好。

局限性 / 可改进方向¶

Heun 方法每步需要两次函数评估（vs EM 的一次），计算成本翻倍
实验仅在三个标准 PDE benchmark 上验证，未在更复杂的实际问题上测试
100D BZ 问题所有方法表现都不好（RL2 > 1.7），说明高维耦合 FBSDE 仍然很有挑战性
未讨论与自适应步长策略的结合

评分¶

新颖性: ⭐⭐⭐⭐ 发现并解释了一个被忽视的重要问题，解决方案优雅
实验充分度: ⭐⭐⭐⭐ 理论+实验互相印证，消融充分
写作质量: ⭐⭐⭐⭐⭐ 数学严谨，叙述清晰
价值: ⭐⭐⭐⭐ 对 BSDE-PDE 社区有重要贡献