Integer Programming for Generalized Causal Bootstrap Designs¶
会议: ICML2025
arXiv: 2410.21464
代码: 未公开(文中提及开源求解器)
领域: 优化 / 因果推断 / 实验设计
关键词: 因果 bootstrap, 整数规划, 设计不确定性, 方差上界, 最不利 copula, 有限总体推断
一句话总结¶
提出基于整数规划(IP)数值求解最不利 copula 的方法,将因果 bootstrap 的设计不确定性量化从"完全随机化 + 均值差估计量"推广到任意已知概率分配与线性/二次处理估计量,并证明渐近有效性。
研究背景与动机¶
在实验因果推断中,不确定性来源分为两类:
抽样不确定性(sampling uncertainty):样本是从超总体中抽取时产生的随机性,经典 bootstrap 和 Wald 型置信区间主要估计这一来源。
设计不确定性(design uncertainty):有限总体模型下,随机分配处理/对照带来的随机性。每个个体只能观测到一种潜在结果(处理或对照),因此统计量在不同随机化下会波动。
在地理实验(如国家级 A/B 测试)等场景中,样本量小(几十到几百)、处理效果异质性大、且样本几乎覆盖全部总体,此时抽样不确定性方法往往过于保守。Neyman 方差分解中,方差项 \(S_\tau^2\)(个体级处理效果方差)依赖于未观测的联合分布,无法直接估计。
现有局限:
- Aronow et al. (2014) 和 Imbens & Menzel (2021) 的因果 bootstrap 方法仅适用于完全随机化分配 + 均值差估计量,利用 isotone copula(排序配对)的解析解。
- 对于匹配配对设计、Horvitz-Thompson 估计量、doubly-robust 估计量等非标准组合,isotone copula 不再是已知的最不利分布,缺乏通用方法。
本文动机:通过整数规划数值求解最不利 copula,绕过对解析解的依赖,从而推广到更多估计量和分配机制。
方法详解¶
核心框架¶
目标是找到最大化估计量方差的联合潜在结果分布 \(F_{0,1}\):
其中 \(\mathcal{C}\) 是对联合分布的约束集合,确保与观测边际分布一致。
整数规划建模¶
决策变量:引入指示变量 \(X_{ik}^{(a)} := \mathbb{I}(Y_i(a) = y_k)\),其中 \(a \in \{0,1\}\) 为处理状态,\(i\) 为个体,\(y_k\) 为离散结果值。
目标函数:方差可表示为二次型 \(\mathbf{Var}_Z[\hat{\tau}] = \mathbf{X}^T \mathbf{Q} \mathbf{X}\),其中 \(\mathbf{Q} = \mathbf{Y}^T \mathbf{\Sigma}_{ZZ} \mathbf{Y}\),\(\mathbf{\Sigma}_{ZZ}\) 为处理分配的协方差矩阵。由于 \(X\) 为二值变量,二次项可线性化,转化为标准整数线性规划。
约束条件(以完全随机化为例):
- (a) 观测锁定:\(X_{ik}^{(Z_i)} = 1\) 当且仅当 \(Y_i^{obs} = y_k\),观测到的潜在结果固定。
- (b) 支撑约束(可选):\(X_{ik}^{(a)} = 0\) 若 \(y_k \notin \text{supp}(F_a)\),限制潜在结果只取已观测值。
- (c) 唯一匹配:\(\sum_k X_{ik}^{(a)} = 1\),每个个体在每种处理下只取一个值。
- (d) 边际匹配:\(\sum_i X_{ik}^{(a)} (Z_i/N_1 - (1-Z_i)/N_0) = 0\),确保观测与缺失的边际分布一致。约束 (d) 可能不可行,引入松弛参数 \(\epsilon\)。
Lemma 2.1:当 \(\epsilon \geq 1/\min(N_0, N_1)\) 时,整数规划保证可行。
估计量推广¶
线性处理估计量:形如 \(\hat{\tau} = \sum_i Z_i a_i + b_i\),包括 Horvitz-Thompson 估计量。方差为 \(\sum_{i,j} a_i a_j \mathbf{Cov}[Z_i, Z_j]\),只需将 \(\mathbf{Q}\) 替换为 \(\mathbf{Q}' = \mathbf{Y}^T \mathbf{U}^T \mathbf{\Sigma}_{ZZ} \mathbf{U} \mathbf{Y}\)。
二次处理估计量:形如 \(\hat{\tau} = \sum_i b_i + \sum_j Z_i Z_j a_{ij}\),包括线性回归对处理变量和协变量的拟合。方差涉及四阶矩 \(\mathbf{Cov}[Z_i Z_j, Z_k Z_l]\)。
Doubly-Robust 估计量:利用样本外拟合的协变量预测函数,将问题转化为对残差 \(Y_i' = Y_i - Z_i \hat{f}_1(W_i) - (1-Z_i)\hat{f}_0(W_i)\) 应用 Horvitz-Thompson 估计量。
分配机制推广¶
一般已知概率分配:将约束 (d) 推广为基于倾向性得分加权的边际匹配:
条件非混杂分配:利用协变量 \(W_i\) 的条件边际分布匹配,添加更细粒度约束以收紧置信区间。
渐近有效性¶
Theorem 4.1:对无混杂分配,\(\mathbb{P}(V^* \geq \mathbf{Var}_Z[\hat{\tau}]) \geq 1 - \beta\),其中 \(\beta = 8\exp(-\epsilon^2 N \tilde{P}/4) + O(\text{Cov}(Z_i,Z_j))\),随 \(N\) 增大趋于 0。
Theorem 4.3:对有界混杂的个体分配,当松弛 \(\epsilon \geq \delta\)(混杂度)时同样渐近有效。
实验关键数据¶
使用 IMF 公开的 2017–2019 年 GDP 数据(前 50 国),模拟国家级地理实验。
主要结果(Table 1 - A/A 测试,95% CI 宽度)¶
| 协变量 | 方法 | 完全随机覆盖率 | 匹配配对覆盖率 | 完全随机 CI | 匹配配对 CI |
|---|---|---|---|---|---|
| 无 | Sampling Bootstrap | 90% | 100% | 3967 | 4110 |
| 无 | Conservative Var. | 98% | 100% | 3991 | 1152 |
| 无 | Isotone Copula | 87% | 0% | 3348 | 44 |
| 无 | Opt. Causal Boot. | 87% | 100% | 3348 | 2233 |
| 2018 GDP | Sampling Bootstrap | 91% | 100% | 141 | 142 |
| 2018 GDP | Opt. Causal Boot. | 90% | 100% | 133 | 102 |
核心发现¶
- 完全随机化下:本文方法与 isotone copula 完全一致,验证了 IP 求解正确性。
- 匹配配对下:isotone copula 覆盖率降至 0%(方差估计为零),本文方法覆盖率 100%,CI 宽度合理。
- CI 宽度:相比 sampling bootstrap,本文方法在所有实验中 CI 宽度缩减 ≥10%,差值估计量+乘法效果场景下缩减达 50%。
- 加入前期 GDP 协变量后,CI 宽度从约 3000+ 大幅降至 ~130,体现协变量调整的巨大收益。
可扩展性¶
- 匹配配对设计:50 个单位平均 671 秒(IP 求解)
- 完全随机化设计:LP 松弛仅需 22 秒
- 计算复杂度随单位数增长,适用于数百规模的数据集
亮点与洞察¶
- 方法论突破:用整数规划替代解析求解最不利 copula,解锁了因果 bootstrap 对非标准设计(匹配配对等)和非标准估计量(doubly-robust、线性回归等)的适用性。
- Isotone copula 的失效案例:匹配配对设计下 isotone copula 覆盖率为 0% 是极好的反例——配对良好时反事实填补会导致方差退化为零。
- 理论完备性:覆盖了无混杂、条件无混杂、有界混杂三类分配机制的渐近有效性证明。
- 实用价值:地理实验(国家/城市级 A/B 测试)是工业界常见场景,本文直接解决了该场景的不确定性量化痛点。
局限与展望¶
- 计算可扩展性:整数规划的求解时间随单位数快速增长,目前仅适用于数百规模的小样本,大规模实验需要近似算法。
- 覆盖率不足:在完全随机化+重尾数据下,所有 bootstrap 方法的覆盖率低于名义水平(87-91% vs 95%),边际分布收敛慢是根本原因。
- 未覆盖一般混杂分配:仅证明了有界混杂的个体分配,一般混杂机制的渐近有效性留作未来工作。
- 离散化假设:连续结果需离散化为观测值支撑,当缺失潜在结果的支撑超出观测范围时,上界不再保证有效。
- 协变量维度:条件边际匹配在高维/连续协变量下收敛更慢,实际改进可能有限。
相关工作与启发¶
- Neyman (1923):有限总体因果推断的奠基工作,方差分解的起点
- Aronow et al. (2014):证明 isotone copula 是完全随机化+DIM 下的方差最大化 copula
- Imbens & Menzel (2021):提出因果 bootstrap 重采样方法,本文的直接前身
- Harshaw et al. (2021):通过凸优化求二次型方差界,但限于二次形式
- Ji et al. (2023):用最优传输估计联合分布泛函的界,对偶方法但不显式求解耦合
- 启发:将因果推断中的不可识别问题转化为数学规划问题是一种通用思路,可推广到其他反事实估计任务
评分¶
- 新颖性: ⭐⭐⭐⭐ — 整数规划求最不利 copula 的思路新颖,解锁了之前不可处理的设计×估计量组合
- 实验充分度: ⭐⭐⭐ — IMF GDP 数据模拟设计合理,但仅一个数据集,缺少更多实际应用场景验证
- 写作质量: ⭐⭐⭐⭐ — 从简单到一般的展开清晰,理论证明完整
- 价值: ⭐⭐⭐⭐ — 对地理实验等小样本因果推断场景有直接实用价值
相关论文¶
- [ICLR 2026] Constraint Matters: Multi-Modal Representation for Reducing Mixed-Integer Linear programming
- [ICML 2025] Sparse Causal Discovery with Generative Intervention for Unsupervised Graph Domain Adaptation
- [ICML 2025] SDP-CROWN: Efficient Bound Propagation for Neural Network Verification with Tightness of Semidefinite Programming
- [AAAI 2026] A Distributed Asynchronous Generalized Momentum Algorithm Without Delay Bounds
- [ICLR 2026] Deep FlexQP: Accelerated Nonlinear Programming via Deep Unfolding