PIMRL: Physics-Informed Multi-Scale Recurrent Learning for Burst-Sampled Spatiotemporal Dynamics¶

会议: AAAI 2026
arXiv: 2503.10253
代码: 无
领域: 科学计算 / 物理信息学习
关键词: 物理信息学习, 多尺度时空动力学, burst采样, PDE求解, 循环网络

一句话总结¶

提出 PIMRL 框架，针对 burst 采样（短段高频+长间隔）的稀疏时空数据，结合宏观尺度潜空间推理和微观尺度物理校正的双模块架构，通过跨尺度消息传递融合信息，在 5 个 PDE 基准上将误差最多降低 80%。

研究背景与动机¶

领域现状：学习PDE时空动力学的主流方法（FNO、DeepONet、PeRCNN 等）大多依赖密集均匀采样的数据。但实际场景（移动传感、物理实验）中数据常是 burst 采样的——短段高频段后跟长间隔。
现有痛点：（a）纯数据驱动方法（FNO）需要大量高质量数据；（b）物理信息方法（PeRCNN、PINN）依赖小时间步进行局部更新，长期预测时误差累积；（c）现有方法都假设均匀时间采样，对 burst 采样这种多尺度不规则数据应对不佳。
核心矛盾：burst 采样数据中，微观尺度有高频物理细节但时间短且稀疏，宏观尺度有连续时跨但丢失了瞬态动力学。如何同时利用这两个尺度的互补信息？
本文要解决什么？ 从 burst 采样的多尺度稀疏数据中准确学习长期时空动力学。
切入角度：设计双模块框架——微观模块用物理先验从高频段提取精细动力学，宏观模块在潜空间做高效大步长推理，通过消息传递融合两者。
核心 idea 一句话：微观物理校正 + 宏观潜空间推理 + 跨尺度消息传递，三者协同从 burst 稀疏数据中实现准确长期预测。

方法详解¶

整体框架¶

PIMRL 由两个模块 + 消息传递机制组成（Figure 2）： - 微观模块（PeRCNN-based）：小时间步 \(\delta t\)，用物理约束卷积捕捉精细动力学 - 宏观模块（残差 ConvLSTM 自编码器）：大时间步 \(\Delta t = k \cdot \delta t\)，在潜空间高效长程推理 - 跨尺度消息传递：微观模块输出校正宏观模块状态，宏观模块输出引导微观模块迭代

关键设计¶

微观尺度模块（PeRCNN Π-block）:
做什么：从 burst 高频数据段中学习精细的物理动力学
核心思路：采用 PeRCNN 的 Π-block 架构，用前向 Euler 离散化 \(\mathbf{u}_{(k+1)\delta t} = \hat{\mathcal{F}}(\mathbf{u}_{k\delta t}) \cdot \delta t + \mathbf{u}_{k\delta t}\)，其中 \(\hat{\mathcal{F}}\) 由多通道卷积的乘积近似：\(\hat{\mathcal{F}}(\mathbf{u}) = \sum_c W_c \cdot [\prod_l (K_{c,l} \star \mathbf{u} + b_l)]\)。已知物理项（如拉普拉斯算子）的卷积核直接由有限差分模板设定
设计动机：硬编码已知物理先验（physics-based Conv layer）使得少量数据即可学到精确动力学，同时 Π-block 捕捉未知部分
宏观尺度模块（残差 ConvLSTM 自编码器）:
做什么：在潜空间中大步长推理，桥接 burst 间的长时间间隔
核心思路：编码器将物理空间映射到紧凑潜空间，ConvLSTM 在潜空间中以 \(\Delta t\) 步长推进状态，解码器重建物理空间预测。关键是周期性接收微观模块的校正消息来锚定物理一致性
设计动机：直接在物理空间大步长推理效果差（丢失瞬态），在潜空间推理更高效且表达力强。微观校正防止潜空间轨迹漂移
跨尺度消息传递:
做什么：融合微观和宏观两个模块的信息
核心思路：三层嵌套循环——（a）微观模块执行 \(k\) 步小步长 rollout 生成物理校正消息 \(\mathbf{u}_{t+k\delta t}^{micro}\)；（b）该消息传给宏观模块进行状态更新 \(\hat{\mathbf{u}}_{t+2k\delta t} = F_{macro}(\mathbf{u}_{t+k\delta t}^{micro})\)；（c）宏观模块自主 rollout \(N-1\) 步后再次接收微观校正，完成 \(2N\) 步预测循环
设计动机：仅在 burst 数据可用时启用微观校正，其余时段宏观模块独立推理——完美匹配 burst 采样的稀疏模式

损失函数 / 训练策略¶

宏观尺度数据计算 RMSE 损失训练整体框架
微观模块单独用 burst 高频段数据预训练
仅宏观模块输出参与最终预测和损失计算
训练数据极少（2-13 条轨迹）

实验关键数据¶

主实验¶

5 个 PDE 系统（1D KdV、2D Burgers、2D FN、2D GS、3D GS）：

数据集	PIMRL RMSE	前 SOTA RMSE	提升
KdV	0.0457	0.0942 (PeRCNN)	51.5%
Burgers	0.0068	0.0075 (PeRCNN)	9.3%
FitzHugh-Nagumo	0.1349	0.1591 (PeRCNN)	15.2%
2D Gray-Scott	0.0133	0.0455 (PeRCNN)	70.8%
3D Gray-Scott	0.0116	0.0532 (PeRCNN)	78.2%

在最具挑战性的 3D Gray-Scott 上误差降低近 80%！

消融实验¶

配置	效果
仅微观模块 (PeRCNN)	长期误差累积，无法跨越大间隔
仅宏观模块 (ConvLSTM)	丢失物理精度，预测粗糙
w/o 消息传递	宏观模块轨迹漂移
完整 PIMRL	最优性能

关键发现¶

FNO 在多个场景下完全发散（NaN），证明纯数据驱动方法在数据稀缺 + burst 采样下不可靠
PeRCNN 是最强基线——物理硬编码使其数据效率高，但大时间步外推能力差
PIMRL 在仅 2 条训练轨迹的 2D Gray-Scott 上就能达到 0.0133 RMSE（PeRCNN 需要 0.0455）
HCT（高校正时间）指标上 PIMRL 也全面领先，说明不仅短期准，长期也稳定

亮点与洞察¶

burst 采样是一个被严重忽视的实际问题：论文首次系统性地处理这类数据模式，填补了空白
跨尺度消息传递的设计非常自然——微观提供物理锚点，宏观提供高效推理，消息传递的时机恰好对应 burst 数据的可用窗口
极少数据需求（2-13 条轨迹）展示了物理信息框架在数据稀缺场景的巨大优势
从 1D 到 3D 的拓展验证了框架的通用性

局限性 / 可改进方向¶

微观模块基于 PeRCNN 需要已知部分PDE先验（如扩散项的形式），对完全未知系统需要适配
宏观模块的 ConvLSTM 在极长序列或高维空间上可能效率受限
\(k\)（微观/宏观步数比）和 \(N\)（消息传递周期）是需要调的超参数
仅在合成 PDE 数据上验证，真实实验数据（含噪声、测量误差）未测试

评分¶

新颖性: ⭐⭐⭐⭐ 首次系统处理 burst 采样下的 PDE 学习，跨尺度消息传递有新意
实验充分度: ⭐⭐⭐⭐ 5 个数据集（1D-3D）、多基线、消融完整
写作质量: ⭐⭐⭐⭐ 问题定义清晰，框架图直观，但部分公式和循环描述较绕
价值: ⭐⭐⭐⭐ 为稀疏/多尺度采样的物理系统建模提供了有效方案