A Switching Framework for Online Interval Scheduling with Predictions¶

会议: AAAI 2026
arXiv: 2511.16194
代码: 无
领域: 在线算法 / 学习增强算法 / 调度优化
关键词: 在线区间调度, 学习增强算法, 竞争比, 一致性-鲁棒性权衡, 随机化算法

一句话总结¶

针对不可撤销的在线区间调度问题，提出 SemiTrust-and-Switch 框架和 SmoothMerge 随机算法，通过在信任预测和经典贪心算法之间切换/融合，在预测准确时趋近最优（一致性），预测错误时性能优雅退化（鲁棒性和平滑性），并证明了该框架在特定实例上的紧性。

背景与动机¶

在线区间调度是一个经典问题：区间按到达顺序出现，算法必须立即不可撤销地接受或拒绝，目标是最大化被接受区间的总长度。经典结果表明，在最坏情况下没有确定性算法能取得常数竞争比（Lipton & Irani 1994），随机算法的下界是 $O(\log \Delta)$，其中 $\Delta$ 是最长与最短区间的长度比。

然而实际场景中，往往可以通过历史数据或机器学习模型获得对未来区间的预测。近年来"学习增强算法"（algorithms with predictions）兴起，核心思路是设计能利用预测改善性能、同时在预测出错时保持鲁棒的算法。

此前的相关工作：(1) 单位权重区间调度+预测（Antoniadis et al., WADS 2023）；(2) 比例权重+可撤销设定（Karavasilis et al., 2025）。但不可撤销+比例权重这一最具实际意义的设定尚无研究，本文正是填补这个空白。

核心问题¶

在不可撤销的在线区间调度中，如何利用（可能不准确的）机器学习预测来提升算法性能？具体来说，如何设计算法使其： 1. 一致性好：当预测准确时，性能接近离线最优 2. 鲁棒性好：当预测完全错误时，性能不会太差 3. 平滑性好：性能随预测误差优雅退化，而非断崖式下降

这个问题的核心难点在于决策不可撤销——早期接受了错误预测的区间后，可能永久阻断后续高价值区间。

方法详解¶

整体框架¶

论文提出三层递进的算法设计： 1. Trust-and-Switch（热身）：先信任预测，发现预测出错后一次性切换到经典算法 2. SemiTrust-and-Switch（主框架）：在信任阶段仅对短区间信任预测，长区间始终贪心接受，再配合同样的切换机制 3. SmoothMerge（随机算法）：将 Trust 策略和 Greedy 策略通过概率融合，实现平滑过渡

输入是在线到达的区间序列，以及二值预测 $\hat{O} = \{0, 1\}^n$ 表示每个区间是否应接受。输出是最大化总长度的非重叠子集。

关键设计¶

Trust-and-Switch 框架：算法从 trust phase 开始，盲目跟随预测。每当新区间 $I_j$ 到达时，计算评估点 $t_j$，比较截至 $t_j$ 时预测解 $|Trust(\mathcal{I})|$ 和离线最优 $|Opt(\mathcal{I})|$ 的差距。一旦发现预测解严格差于最优，就不可逆地切换到经典 $\theta$-竞争算法。核心保证：1-一致性 + $|Opt| \leq \theta \cdot |Alg| + 2k$（$k$ 为最大区间长度）。
SemiTrust-and-Switch 框架：引入长度阈值 $\tau$。在 trust phase 中，长度超过 $\tau$ 的区间直接贪心接受（不依赖预测），长度低于 $\tau$ 的区间才依赖预测。这样即使预测不准，也不会错过高价值的长区间。代价是一致性从 1 退化为 $(1 + k/\tau)$，但鲁棒性显著提升为 $|Opt| \leq \max(\theta, \Delta+1) \cdot |Alg| + \tau$。阈值 $\tau$ 可调，控制一致性和鲁棒性之间的权衡曲线。
SmoothMerge 随机算法：并行模拟 Trust 和 Greedy 两个策略。对每个到达的区间，如果两策略一致（都接受或都拒绝），则按一致决策执行；如果不一致，以概率 $p_t$（Trust 概率）或 $p_g$（Greedy 概率）随机接受。核心保证： $$\mathbb{E}[|Alg|] \geq \max\left\{|Opt| \cdot (1-\eta) \cdot p_t \cdot (1-p_g),\quad \frac{p_g - p_t p_g}{1 - p_t p_g} \cdot |Greedy|\right\}$$ 其中 $\eta$ 是预测误差。通过调节 $p_t, p_g$ 可在平滑性和鲁棒性之间连续插值。

预测模型¶

二值预测 $\hat{O}$：对每个区间给出 accept/reject 建议，随区间在线到达
全信息预测 $\hat{I}$：预测所有区间的到达时间和截止时间（更强的预测模型）
一个有趣的结论是：更详细的预测或离线预测并不能改善可达的理论保证

损失函数 / 训练策略¶

本文是理论算法设计工作，不涉及训练。核心性能指标是竞争比的一致性和鲁棒性。

实验关键数据¶

实验基于真实调度数据（NASA-iPSC-1993 和 CTC-SP2-1996 并行机器调度 benchmark）：

数据集	区间数	最大截止时间
NASA-iPSC-1993-3.1	18,065	62,643
CTC-SP2-1996-3.1	77,205	71,998

通过控制预测中被破坏的区间数量来模拟不同的预测误差 $\eta$
SmoothMerge 在预测误差较小时性能接近 Opt，误差增大时在 Trust 和 Greedy 之间平滑过渡
当预测误差很大时，SmoothMerge 降级为接近 Greedy 的表现，不会崩溃
Trust 策略随预测误差增大性能急剧下降，而 SmoothMerge 退化平缓

消融实验要点¶

$p_t = 1, p_g = 0$ 时退化为纯 Trust（完美平滑性，无鲁棒性）
$p_t = 0, p_g = 1$ 时退化为纯 Greedy（完全鲁棒，无平滑性）
中间取值（如 $p_t = 0.6, p_g = 0.4$）同时获得两个性质，但系数有所折损

亮点¶

切换时机的精巧设计：Trust-and-Switch 在发现预测出错后只切换一次且不可逆，但通过精心选取评估点 $t_j$（考虑预测区间的截止时间），确保在预测准确时永远不会误触发切换——从而保证完美的 1-一致性
SemiTrust 中的阈值思想：长区间贪心+短区间信任预测，这个简单分治策略优雅地将鲁棒性从 $+2k$ 改善到了 $+\tau$（$\tau < k$），且一致性损失可控
冲突图分析方法：将 Opt 和 Alg 的选择建模为冲突图的连通分量来分析，这一技巧可迁移到其他在线优化问题
紧性证明构造性对手：通过精心设计的对抗实例证明框架在两值实例上的最优性，展示了 consistency-robustness 的根本 tradeoff

局限性 / 可改进方向¶

两值实例已紧，一般情况有 gap：上下界在两值（short/long）实例上匹配，但一般实例的 gap 尚未封闭
仅考虑区间长度作为权重：没有扩展到任意权重的区间调度，而实际中权重可能与长度无关
预测误差的粒度：当前二值预测模型比较粗糙，更精细的预测信息（如置信度）可能带来更好的保证
实验规模有限：仅在两个 benchmark 上测试，缺乏对不同 $\Delta$ 值的系统性实验
潜在扩展：可撤销设定、多资源调度、带约束的调度等变体

与相关工作的对比¶

工作	设定	决策	主要贡献
Antoniadis et al. (WADS 2023)	单位权重	不可撤销	确定性算法紧界
Karavasilis et al. (2025)	比例权重	可撤销	二值预测下的自适应算法
本文	比例权重	不可撤销	统一框架 + 随机平滑算法

本文的核心差异是：(1) 解决了最困难的"不可撤销+比例权重"设定；(2) 提出了通用框架而非特定算法，可插入任何经典算法作为后备；(3) SmoothMerge 是首个在此设定下实现平滑性的算法。

启发与关联¶

这类"信任-切换"范式可以迁移到其他在线最大化问题（如在线背包、匹配）
冲突图分析方法值得学习，在分析贪心类算法性能时很有用
预测误差 $\eta$ 的定义方式（基于 Trust 与 Opt 的比值）可作为评估"预测对算法有多大帮助"的通用度量

评分¶

新颖性: ⭐⭐⭐⭐ 填补了重要设定空白，框架设计有新意，但switching技术本身不算全新
实验充分度: ⭐⭐⭐ 理论工作，实验仅作为补充验证，规模和多样性有限
写作质量: ⭐⭐⭐⭐⭐ 结构清晰，从warm-up逐步推进到主框架和随机化，proof sketch直观
价值: ⭐⭐⭐⭐ 对学习增强在线算法领域有贡献，框架的模块化设计具有通用性