Predicting Public Health Impacts of Electricity Usage¶
会议: NeurIPS 2025
arXiv: 2511.22031
代码: https://github.com/Ren-Research/Health-Impact-Predictor
领域: 地球科学 / AI for Social Good
关键词: 公共健康, 电力系统, 空气污染, 端到端预测, 电动汽车充电优化
一句话总结¶
提出 HealthPredictor,一个将电力消费端到端映射到公共健康损害(以 $/MWh 计量)的 AI 流水线,包含燃料组合预测、空气质量转换和健康影响评估三个模块,健康驱动优化比燃料组合驱动基线显著降低健康影响预测误差,并在电动汽车充电调度案例中实现 24-42% 的健康损害减少。
研究背景与动机¶
-
领域现状:电力行业是空气污染物排放的主要来源之一,化石燃料发电产生的 PM2.5、SO2、NOx 等污染物通过大气传输影响公众健康。即使到 2050 年,化石燃料仍将占据美国电力供应的相当比例。
-
现有痛点:
- 现有研究要么只关注空气污染与健康的流行病学关联,要么只关注能源到排放的转换,缺乏端到端框架
- EPA 提供的年均健康损害数据缺乏时间变化,无法支持动态需求侧管理
-
WattTime 提供实时健康影响信号,但方法不透明且仅反映边际损害
-
核心矛盾:电力需求的很大部分是可动态调控的(如数据中心负载、EV 充电),但缺乏将用电决策和具体健康后果直接关联的 AI 工具。
-
切入角度:设计一个端到端的管线,从燃料组合时间序列出发,经过排放估算、大气扩散建模、健康经济学评估,最终输出 $/MWh 的健康成本信号。
-
核心idea一句话:用健康影响损失直接优化燃料组合预测器(而非仅优化燃料预测精度),使预测信号更准确地反映真实健康后果。
方法详解¶
整体框架¶
三级流水线:燃料组合预测(Transformer 时间序列模型)→ 空气质量转换(排放估算 + 神经网络扩散模型)→ 健康影响评估(对数线性浓度-响应模型 + 经济估值)。端到端训练时将健康影响损失反传至燃料预测器。
关键设计¶
- Fuel Mix Predictor(燃料组合预测器):
- 做什么:基于历史燃料组合时间序列预测未来 T 小时(24h/72h)的燃料使用比例
- 核心思路:Transformer 架构(单层 encoder-decoder,4 头注意力),输入嵌入到 64 维空间
-
设计动机:燃料组合数据具有长期时间依赖(日周期、季节性),Transformer 擅长捕获这些模式
-
Air Quality Converter(空气质量转换器):
- 做什么:从燃料组合预测中计算排放量,再建模污染物大气扩散
- 核心思路:排放估算基于每种燃料的排放因子;扩散建模用 3 层 MLP 近似 EPA COBRA 模型的源-受体矩阵,即 \(\mathscr{P}_r^1, ..., \mathscr{P}_r^M = D_{\boldsymbol{w}}(\mathscr{P}_s)\)
-
设计动机:COBRA 等全物理扩散模型运行耗时(每次 5-20 分钟),用神经网络近似实现实时预测
-
Health Impacter(健康影响评估器):
- 做什么:将污染物浓度变化转换为货币化健康损害($/MWh)
- 核心思路:对数线性浓度-响应模型 \(\Delta Y^i = Y_0^i \times \text{POP}^i \times (1 - e^{-\alpha^T \Delta \mathscr{P}_r^i})\),其中 \(Y_0^i\) 是基线发病率,\(\text{POP}^i\) 是暴露人口,\(\alpha\) 是流行病学系数
- 区分内部(BA 辖区内)和外部(辖区外)健康影响
损失函数 / 训练策略¶
健康驱动损失:\(\mathcal{L} = \beta \|y_t - \hat{y}_t\|^2 + (1-\beta) \|y_{\text{impact},t} - g(\hat{y}_t, I)\|^2\)
其中 \(\beta\) 控制燃料预测精度和健康影响预测精度之间的权衡。\(\beta\) 接近 1 为燃料驱动优化,\(\beta\) 较小为健康驱动优化。关键洞察:直接优化健康影响损失比仅优化燃料预测更能降低下游健康预测误差。
实验关键数据¶
主实验¶
在美国三个主要电力区域测试:CISO(加州)、ERCO(德州)、PJM(中大西洋),覆盖不同能源结构和人口密度。
| 方法 | 健康影响 NMAE (T=24) | 健康影响 NMAE (T=72) |
|---|---|---|
| LSTM Fuel-driven | 较高 | 较高 |
| LSTM Health-driven | 中等 | 中等 |
| Transformer Fuel-driven | 中等 | 中等 |
| Transformer Health-driven | 最低 | 最低 |
EV 充电案例研究¶
| 充电策略 | 健康损害减少 |
|---|---|
| First Hours (最早充电) | baseline |
| Latest Hours (最晚充电) | baseline |
| Continuous Charging | 15-20% 减少 |
| Optimal (本文) | 24-42% 减少 |
关键发现¶
- Health-driven Opt 始终比 Fuel-mix-driven Opt 在健康影响预测上更准确
- Transformer 架构全面优于 LSTM 基线
- 将健康影响纳入预测器训练是确保准确信号输出到用户的必要条件
- 数据集构建本身是重大工程贡献:覆盖美国 67 个 BA 的 586,920 个数据点
亮点与洞察¶
- 端到端健康感知训练范式:将下游健康影响直接纳入上游预测器的训练目标,而非分阶段独立优化。这种"目标对齐"思路普遍适用于需要多阶段决策的问题
- 数据集工程:跨机构数据融合(EIA 8 种燃料分类 vs EPA eGRID 40+ 种、BA 区域 vs 县级健康数据)是被低估但极其重要的贡献
- 实际可操作性强:提供实时 $/MWh 健康成本信号,用户/调度系统可直接使用
局限性 / 可改进方向¶
- 仅覆盖短期预测窗口(24-72h),长期健康累积效应未建模
- 大气扩散模型基于 EPA COBRA 的简化版本,忽略了实时气象变化
- 未考虑温室气体的间接健康影响
- 神经网络扩散模型的物理可解释性有限
相关工作与启发¶
- vs EPA COBRA:COBRA 是规范工具但运行慢且数据输入繁琐,HealthPredictor 实现了实时推理
- vs WattTime:WattTime 提供类似信号但方法不透明,本文方法完全公开且端到端可训练
- 对 AI for Social Good 领域有示范意义:展示了如何将技术系统(电力消费)的外部性(健康损害)量化并反馈到决策中
评分¶
- 新颖性: ⭐⭐⭐⭐ 端到端电力-健康映射的问题定义和解决框架很新颖
- 实验充分度: ⭐⭐⭐⭐ 三个区域 + EV 充电案例 + 消融实验,验证充分
- 写作质量: ⭐⭐⭐⭐ 问题动机清晰,流水线描述完整
- 价值: ⭐⭐⭐⭐⭐ 直接服务公共健康决策,社会影响力大