跳转至

Distributional Equivalence in Linear Non-Gaussian Latent-Variable Cyclic Causal Models

会议: ICLR 2026 (Oral)
arXiv: 2603.04780
代码: MarkDana/Equiv-LiNG-Latent / 在线演示
领域: 因果推断 / 因果发现
关键词: 因果发现, 潜变量, 循环因果模型, 分布等价性, 边秩约束, 非高斯模型

一句话总结

首次在线性非高斯设定下、不依赖任何结构假设,给出了含潜变量和环的因果图之间分布等价性的完整图准则,核心工具是新提出的边秩约束(edge rank constraints),据此开发了遍历等价类和从数据恢复因果模型的算法——这是参数化因果模型中首个无结构假设的等价性刻画和发现方法。

研究背景与动机

领域现状:因果发现旨在从观测数据中推断因果关系,是因果推理的基础任务。在现实场景中,数据往往存在未观测的潜变量(latent variables)和因果循环(cycles),如基因调控网络中的反馈环路、经济系统中的相互因果。这使得因果发现成为极具挑战的问题。

现有痛点: 1. 大多数方法要求潜变量具有特定的指示模式(indicator patterns),如每个潜变量至少影响两个观测变量且不共享 2. 部分方法限制潜变量只能以特定方式与其他变量交互(如无直接潜-潜因果关系) 3. 几乎所有方法禁止因果图中存在环(循环因果关系),仅处理 DAG 结构 4. 这些结构假设在实际应用中常常不成立,严重限制了方法的适用范围

核心矛盾:走向通用、无结构假设方法的核心障碍是缺乏等价性刻画——如果不知道什么能被识别(即哪些图产生相同的观测分布),通常就无法设计出识别方法。没有等价性理论,就不知道因果发现的可达精度上限是什么。

本文方案:在线性非高斯模型(LiNG-Latent)下,建立完整的等价性理论。核心创新是引入边秩约束这一新工具——它填补了现有独立约束(independence constraints)在潜变量设定下不完备的缺口,从而实现了完整的图准则。

方法详解

整体框架

本文方法分三个层次推进,形成从理论到应用的完整链条:

  • 输入:观测数据(假设由线性非高斯模型生成),可能涉及潜变量和因果环
  • 层次1 — 等价性刻画:建立图准则判断两个因果图是否分布等价
  • 层次2 — 等价类遍历:给定一个图,找到其所有分布等价的图
  • 层次3 — 从数据学习:从观测数据恢复因果模型(精度达到等价类级别)

模型形式化为线性结构方程:

\[X = BX + \Lambda L + E\]

其中 \(X\) 是观测变量向量,\(B\) 是观测变量间的因果系数矩阵(允许环),\(L\) 是潜变量,\(\Lambda\) 是潜变量到观测变量的效应矩阵,\(E\) 是非高斯独立噪声。

关键设计1:边秩约束(Edge Rank Constraints)

这是本文的核心技术创新。在潜变量因果模型中,观测变量的混合矩阵包含了因果结构信息。传统方法依赖独立约束(两个变量之间无因果路径 → 统计独立),但在有潜变量时独立约束不完备——两个变量即使没有直接因果关系,也可能通过潜变量产生统计依赖。

边秩约束通过分析混合矩阵子矩阵的来提取因果图中边是否存在以及潜变量结构的信息:

  • 若从变量集 \(S\) 到变量 \(X_i\) 的所有因果路径可以被 \(r\) 个潜变量"解释",则对应的混合矩阵子矩阵秩至多为 \(r\)
  • 这种秩约束比独立约束更精细——独立约束是秩约束的特例(秩为0 = 独立)
  • 边秩约束在独立约束不完备的场景中提供了额外的区分力

关键设计2:分布等价性的完整图准则

两个具有任意潜变量结构和环的因果图分布等价(即产生相同的观测分布集),当且仅当它们施加相同的边秩约束集合。

这个准则的完整性依赖于: - 必要性:不同的边秩约束集 → 不同的分布集(可通过构造反例证明) - 充分性:相同的边秩约束集 → 可以构造参数使两个图产生相同的分布

非高斯性在此扮演关键角色:相比高斯模型,非高斯噪声提供了额外的可识别性信息,使等价类更细(即可区分更多的因果图)。

关键设计3:等价类遍历与学习算法

等价类遍历:给定一个因果图 \(\mathcal{G}\),通过以下操作系统地枚举所有等价图: - 在保持边秩约束不变的前提下,添加/删除/反转观测变量间的边 - 修改潜变量的数量和连接模式 - 验证修改后的图是否施加相同的边秩约束集

从数据学习: 1. 利用独立成分分析(ICA)的原理从数据中估计混合矩阵 2. 通过矩阵秩检验确定边秩约束 3. 搜索满足所有约束的因果图,输出等价类

实验关键数据

主实验:等价性刻画的验证

实验设置 评估内容 核心结果
合成数据(无环、无潜变量) 退化为 LiNGAM 设定 与已知结果完全一致,验证正确性
合成数据(有环、无潜变量) 循环因果模型 图准则正确识别所有等价/不等价图对
合成数据(无环、有潜变量) 潜变量 DAG 边秩约束提供了比独立约束更细的等价类
合成数据(有环+有潜变量) 最一般设定 准则完备——等价类内的图确实不可区分
在线交互演示 equiv.cc 用户自定义验证 用户可手动指定图,系统即时展示等价类

消融实验:约束类型的贡献

约束组合 等价类粒度 可识别性强度
仅独立约束 粗(多个不等价图被合并)
独立约束 + 边秩约束 最细(精确等价类) 最强
高斯模型 + 所有约束 介于两者之间 中等(非高斯性提供额外信息)
非高斯 + 仅秩约束(无独立约束) 接近最细 强(秩约束已包含独立约束)

核心发现

  • 边秩约束是不可或缺的:仅靠独立约束时,多个不等价图被错误归为同一等价类;加入边秩约束后等价类精确收紧
  • 非高斯性提供显著可识别性:相比高斯模型,非高斯设定下等价类更小(更多图可区分),这与 LiNGAM 的经典结论一致
  • 环不根本阻碍因果发现:循环因果关系增大了等价类但未使问题不可解——在线性非高斯设定下仍可进行有意义的因果推断
  • 等价类大小随复杂度增长:但在中等规模图(\(\sim\)10个变量)上仍然可处理

亮点与洞察

  • 理论突破性极强:首个在任何参数化设定下、不依赖结构假设的等价性完整刻画——因果发现领域的里程碑
  • ICLR 2026 Oral:获得口头报告接收,反映审稿人对理论贡献的高度认可
  • 新工具具有独立价值:边秩约束不仅服务于本文,对更广泛的潜变量因果发现问题也有重要应用前景
  • 问题定位精准:"等价性刻画是通用方法的前提"——这一认识论层面的洞察对整个因果发现社区具有指导意义
  • 实用性好:提供了开源代码和在线交互演示 equiv.cc,降低了使用门槛

局限与展望

  • 限于线性模型假设,非线性因果关系(加性噪声模型、后非线性模型等)未涉及
  • 非高斯性假设在某些领域(如金融数据中近似高斯的情况)可能不成立
  • 算法的计算复杂度随变量数量指数增长,大规模问题(>20个变量)的可扩展性有待验证
  • 等价类遍历在极大等价类时面临组合爆炸问题
  • 缺乏在大规模真实数据上的系统评估(实验以合成数据和小规模验证为主)
  • 可以进一步扩展到混合非高斯-高斯、部分非线性等更一般的模型设定

评分

  • 新颖性: ⭐⭐⭐⭐⭐
  • 实验充分度: ⭐⭐⭐
  • 写作质量: ⭐⭐⭐⭐
  • 价值: ⭐⭐⭐⭐⭐

相关论文