Beta Distribution Learning for Reliable Roadway Crash Risk Assessment¶

会议: AAAI 2026
arXiv: 2511.04886
代码: https://www.gb-liang.com/projects/betarisk
领域: 交通安全 / 自动驾驶 / 不确定性估计
关键词: Beta Distribution, 碰撞风险评估, 卫星图像, 不确定性量化, 校准

一句话总结¶

提出基于 Beta 分布学习的地理空间深度学习框架，利用多尺度卫星图像预测道路致命事故风险的完整概率分布（而非点估计），在 Recall 上提升 17-23%，并通过分布形状自然表达不确定性。

研究背景与动机¶

领域现状：道路交通事故每年全球致死超 130 万人，经济损失高达 GDP 的 3%。传统交通安全研究往往独立分析驾驶行为、道路设施、交通模式、天气等因素，忽略了多因素空间交互的复杂性。
现有痛点：现有 DNN 风险估计器提供点估计，不传达模型的不确定性程度；现代 DNN 普遍过度自信（miscalibrated），预测置信度与真实准确率不匹配。事故数据极度稀疏（美国 25m² 路段年均事故率仅约 0.1%），传统估计方法极不可靠。
核心矛盾：安全关键应用要求模型必须 (a) 高召回率——不能遗漏危险区域，且 (b) 校准良好——预测的置信度需真实反映正确概率。但点估计无法区分「确定的低风险」和「不确定的中等风险」。
本文要解决什么：从卫星图像出发，学习一个既准确又校准良好、能输出完整概率分布的道路致死事故风险评估模型。
切入角度：将风险估计建模为 Beta 概率分布学习问题，利用 Beta 分布天然的 [0,1] 支撑和灵活的形状参数来表达风险与不确定性。
核心idea一句话：通过预测 Beta 分布的 (α, β) 参数而非单一风险值，将数据增强中的几何信息转化为结构化的概率监督信号，实现对事故风险的不确定性感知评估。

方法详解¶

整体框架¶

输入三个分辨率（1.19, 0.60, 0.30 m/pixel）的卫星图像切片 → 共享 ResNet-50 backbone 提取特征 → 通道维拼接 → 两个并行预测头：

组件	输出	作用	推理时是否使用
Beta 分布头	(α, β) 两个正标量	定义 Beta(α,β) 分布，均值 R=α/(α+β) 为风险分数	✓
辅助分类头	单一 logit	二分类（有/无事故），辅助 backbone 学习判别特征	✗

关键设计¶

Beta 概率建模

做什么：模型输出 Beta 分布的两个形状参数 (α, β)，而非单一风险标量
核心思路：尖锐的 Beta 分布（大 α+β）表示高置信，宽分布（小 α+β）表示高不确定性。同一个均值 0.5 可以对应「高置信的中等风险」(α=10, β=10) 和「极不确定」(α=2, β=2) 两种截然不同的语义
设计动机：安全关键场景需要模型不仅给出预测，还需表达自身的确信程度。Beta 分布天然定义在 [0,1] 上，完美匹配风险概率的值域

程序化目标分布生成

做什么：根据随机裁剪增强的几何属性，动态生成目标 Beta 分布作为监督信号
核心思路：对正样本，计算影响分数 = 0.7×(1-归一化距离) + 0.3×相对裁剪大小，据此调制目标均值和浓度参数。距离事故中心越近、裁剪越大，目标分布均值越高、越集中
设计动机：事故风险在空间上是连续衰减的——裁剪偏离事故中心时视觉证据变弱，目标分布应更平坦、均值更低。这种方法将数据增强从简单的正则化手段提升为丰富的结构化监督信号源

多尺度输入设计

做什么：三个不同分辨率的卫星图像输入同一 backbone
核心思路：高分辨率捕捉局部道路细节（车道线、交叉口几何），低分辨率捕捉宏观环境上下文（城市密度、周边设施）
设计动机：事故风险由局部道路特征和宏观环境共同决定

损失函数 / 训练策略¶

复合损失函数 \(\mathcal{L} = \lambda_1 \cdot \mathcal{L}_{BCE} + \lambda_2 \cdot \mathcal{L}_{W_2^2}\)，其中 \(\lambda_1=5, \lambda_2=1\)。

\(\mathcal{L}_{W_2^2}\) 为 Wasserstein-2 距离的均值-方差代理形式：\((\mu_p - \mu_t)^2 + (\sigma_p - \sigma_t)^2\)，直接同时优化风险分数（均值）和置信度（标准差）
相比 KL 散度，W₂ 代理在预测分布与目标分布重叠较少时梯度更稳定
\(\lambda_1\) 较大（=5）以优先保证分类能力和召回率

训练细节：75 epochs，AdamW + CosineAnnealingWarmRestarts，分布头 lr=0.02，backbone lr=1e-4，batch size 48（多尺度），NVIDIA A100。

实验关键数据¶

主实验¶

使用 MSCM 数据集（Texas 四大城市，80,276 个地理位置，240,828 张多尺度卫星图像）：

方法	F1	Precision	Recall	AUC	ECE↓	Brier↓
ImageNet	0.4753	0.4968	0.4555	0.7980	0.1281	0.1600
MSCM-SS	0.4966	0.4981	0.4950	0.8165	0.1006	0.1458
MSCM-MS	0.5409	0.6731	0.4521	0.8572	0.1067	0.1296
Prob-MS (本文)	0.5762	0.6296	0.5311	0.8663	0.0881	0.1211

Prob-MS 在最关键的 Recall 指标上比 MSCM-MS 提升 17.5%，同时 ECE（校准误差）最低。

消融实验¶

深度集成对比——单模型 vs 三模型集成：

方法	F1	Recall	ECE↓	Brier↓	Variance↓	Disagr. Rate↓
Ensemble MSCM-MS (3模型)	0.5966	0.5165	0.0787	0.1112	0.0925	16.93%
Ensemble Prob-MS (3模型)	0.5976	0.5361	0.0605	0.1075	0.0822	15.14%
单模型 Prob-MS	0.5762	0.5311	0.0881	0.1211	—	—

单模型 Prob-MS 已接近 3 倍计算成本的集成 MSCM-MS 表现，且在 Recall 上超过 3%。

关键发现¶

基线模型预测严重极化（集中在 0 和 1 两端），而 Prob-MS 利用完整概率谱表达不同程度的确信
模型的错误预测（FP/FN）均伴随更高的不确定性——这意味着模型能「知道自己不确定」
San Antonio River Walk 案例研究：Prob-MS 正确标记了 MSCM-MS 遗漏的多个致命事故地点，并生成空间上更连贯的风险图

亮点与洞察¶

数据增强→概率监督：将随机裁剪的几何属性转化为结构化的 Beta 分布目标，这个思路通用性很强，可迁移到其他需要空间衰减监督的任务
可信的失败模式：即使预测错误，高不确定性也为下游决策提供了有价值的安全信号
仅依赖公开卫星图像：无需交通传感器、路况摄像头等基础设施，具有全球可扩展性
W₂ 代理损失：相比 KL 散度更稳定且直接优化均值+标准差，误差仅 10⁻³ 到 10⁻² 量级

局限性 / 可改进方向¶

只估计静态地理风险，不考虑实时交通流量、天气、时间等动态因素
地理范围限于 Texas，气候、道路设计、驾驶文化差异可能影响泛化
中心性权重 0.7、大小权重 0.3 为手工设定，可通过可学习机制自适应调整
本质是相关性分析而非因果推断——模型学到的是视觉特征与事故的关联，不代表因果

评分¶

新颖性: ⭐⭐⭐⭐ — Beta 分布 + 程序化标签生成的组合简洁而有效
实验充分度: ⭐⭐⭐⭐ — 定量+定性+案例研究+集成对比，覆盖面广但限于单地区
写作质量: ⭐⭐⭐⭐ — 结构清晰，可视化优秀
对我的价值: ⭐⭐⭐⭐ — 不确定性感知预测的思路值得借鉴