The Human Brain as a Combinatorial Complex¶
会议: NeurIPS 2025 (Workshop: NeurReps)
arXiv: 2511.20692
代码: TopoBrainX
领域: 拓扑深度学习 / 脑网络分析 / 医学图像
关键词: 组合复形, 高阶网络, 信息论, S-信息, O-信息, fMRI
一句话总结¶
提出一种数据驱动的框架,利用 S-信息和 O-信息等信息论度量从 fMRI 时间序列中直接构建组合复形(Combinatorial Complexes),将脑区间的高阶协同交互编码到拓扑结构中,为拓扑深度学习应用于脑网络分析奠定基础。
研究背景与动机¶
领域现状:当前脑网络分析几乎完全依赖图表示——将脑区建模为节点,用 Pearson 相关、偏相关、互信息等成对统计度量构建边。这种框架在网络神经科学领域取得了巨大成功,推动了对功能连接、网络拓扑和大脑组织原则的深入理解。
现有痛点:图表示存在一个本质缺陷——它只能捕获成对(pairwise)关系,完全无法表达三个或更多脑区之间的集体依赖关系(higher-order interactions)。对于有 \(N\) 个脑区的系统,图最多捕获 \(\binom{N}{2}\) 个成对关系,但真实大脑的信息处理常常涉及协同交互(synergistic interactions),即只有联合观察多个区域时才能获取的信息,无法分解为成对关系。
核心矛盾:神经科学研究越来越多地发现高阶交互可能是脑网络的重要组织原则,但现有的表示方法从根本上无法捕获这些结构。虽然拓扑数据分析(TDA)提供了一些工具(如 Betti 数、持续同调),但它们主要基于几何或距离过滤,依赖于嵌入空间的假设。
本文目标 如何从神经数据中捕获高阶交互,并将其编码到一种能被拓扑深度学习架构使用的数学结构中?
切入角度:作者观察到组合复形(CC)比单纯复形更灵活——不需要闭合或包含约束——非常适合直接整合连续的信息论度量。同时,多变量信息论的最新进展(S-信息、O-信息)使得高阶依赖的系统量化成为可能。
核心 idea:用 S-信息量化高阶统计依赖的强度、用 O-信息判别协同/冗余性质,以双阈值策略从 fMRI 数据中直接构建组合复形,绕过传统的拓扑提升路径。
方法详解¶
整体框架¶
输入是 fMRI 时间序列矩阵 \(\mathbf{X} \in \mathbb{R}^{N \times T}\)(\(N\) 个脑区,\(T\) 个时间点),输出是一个组合复形 \((S, \mathcal{X}, \mathrm{rk})\)。整体流程分三步:(1) 计算成对统计依赖构建 rank-1 边;(2) 枚举候选高阶子集并计算信息论度量;(3) 通过双阈值策略选择协同性主导的子集作为高阶单元。
关键设计¶
-
组合复形(CC)的数学定义:
- 功能:提供一种能同时容纳成对和高阶关系的统一数学结构
- 核心思路:CC 是三元组 \((S, \mathcal{X}, \mathrm{rk})\),其中 \(S\) 是有限集(脑区集合),\(\mathcal{X} \subseteq \mathcal{P}(S) \setminus \{\emptyset\}\) 是 \(S\) 的幂集的子集,\(\mathrm{rk}: \mathcal{X} \to \mathbb{Z}_{\geq 0}\) 是秩函数。秩函数要求满足:每个单元素集 \(\{s\}\) 都在 \(\mathcal{X}\) 中,且子集关系蕴含秩的单调性(\(x \subseteq y \Rightarrow \mathrm{rk}(x) \leq \mathrm{rk}(y)\))。rank-0 是节点,rank-1 是边,rank-\(k\) 对应 \((k+1)\)-元组
- 设计动机:相比单纯复形(要求闭合性:如果三元组存在则其所有子边也必须存在),CC 放松了这些约束,允许高阶单元独立于其低阶子集存在,这对基于统计度量的构建至关重要——一个三元组可能有强协同性但其成对连接可能较弱
-
S-信息(总统计相互依赖度量):
- 功能:量化一组变量之间的总体统计依赖强度
- 核心思路:\(\Sigma(X) = TC(X) + DTC(X)\),其中 \(TC\) (total correlation) 和 \(DTC\) (dual total correlation) 分别从不同角度量化多变量依赖。\(\Sigma\) 值越高表示子集内的多变量依赖越强,可能包含重要的高阶协同交互
- 设计动机:作为第一道过滤门槛,排除统计依赖较弱的候选集合,确保保留的高阶单元具有足够的信息论意义
-
O-信息(冗余-协同偏向度量)与双阈值策略:
- 功能:区分高阶依赖的性质——是冗余性(信息重复出现在多个源中)还是协同性(信息只有联合观察才可获取)
- 核心思路:\(\Omega(X) = TC(X) - DTC(X)\),\(\Omega < 0\) 表示净协同性,\(\Omega > 0\) 表示冗余性。构建规则采用双阈值:\(\Sigma(x) > \tau\) 且 \(\Omega(x) \lesssim 0\),前者确保依赖强度,后者确保协同性主导。使用 \(\lesssim 0\) 而非严格 \(< 0\) 是为了容纳弱协同性主导但 \(\Omega\) 略正的结构
- 设计动机:脑科学关心的高阶交互主要是协同性的——即那些无法通过成对关系分解的集体信息处理模式。仅用 S-信息无法区分冗余和协同,O-信息的引入使得可以专门定位协同性结构
损失函数 / 训练策略¶
本文是构建表示的工作,尚未涉及下游学习任务。框架产出的 CC 可以作为组合复形神经网络(CCNN)的输入,通过跨多个拓扑秩的消息传递来执行下游任务(如脑状态分类、认知任务解码),但这属于未来工作。信息论度量的计算使用 JIDT(Java Information Dynamics Toolkit)库,通过 JPype 进行 Java-Python 桥接。
实验关键数据¶
主实验(NetSim 合成数据验证)¶
实验使用 NetSim 合成 BOLD 时间序列数据(sim1.mat,50 个被试,每个 5 脑区、200 个时间点)。NetSim 通过动态因果模型(DCM)产生神经过程并耦合非线性 balloon-Windkessel 血流动力学前向模型,模拟真实 fMRI 特性。
| 度量 | 三元组 (2,3,4) | 三元组 (1,2,3) | 阈值要求 |
|---|---|---|---|
| S-信息 Σ | 0.51 | 0.49 | > 0.45 ✓ |
| O-信息 Ω | 0.06 | 0.04 | ≲ 0 ✓(弱正) |
| Rank | 2 | 2 | — |
Rank-1 边的构建基于成对互信息,阈值 MI ≥ 0.02 以确保稀疏性同时保留有意义的连接。
方法特性对比(消融分析)¶
| 特性 | 传统图方法 | 单纯复形 | 本文 CC 方法 |
|---|---|---|---|
| 最大关系维度 | 成对 | 任意阶 | 任意阶 |
| 闭合性约束 | 无 | 需要 | 不需要 |
| 信息类型 | 成对相关 | 几何/距离 | 协同/冗余(数据驱动) |
| 构建基础 | 统计检验 | 距离过滤 | 信息论双阈值 |
| 可扩展性 | \(O(N^2)\) | \(O(N^k)\) | \(O(N^k)\),需优化 |
关键发现¶
- 即使在最小化的 5 区域设置中,CC 也能揭示传统图方法完全不可见的三元组结构,验证了方法的有效性
- 两个被选中的三元组的 O-信息值为弱正(0.06 和 0.04),说明真实神经信号中的协同-冗余界限并非截然分明,使用 \(\lesssim 0\) 而非严格 \(< 0\) 的设计选择是合理的
- 计算复杂度是关键瓶颈:从 \(\binom{5}{3} = 10\) 个候选三元组到 \(\binom{100}{3} = 161{,}700\) 个,增长极快,\(N > 50\) 时超出桌面计算能力
亮点与洞察¶
- 数据驱动 vs 拓扑提升:现有 TDL 工作通常通过拓扑提升(topological lifting)从已有的图结构映射到高阶域,本文绕过这一步骤,直接从时间序列的统计依赖构建 CC。这避免了"先构建图再提升"路径中可能丢失的高阶信息
- 信息论度量的巧妙组合:S-信息解决"有没有依赖"的问题,O-信息解决"依赖是什么性质"的问题,二者互补构成完整的筛选标准。这种双标准策略可以直接迁移到任何需要区分冗余和协同交互的多变量分析任务
- 框架的通用性:虽然以 fMRI 为切入点,但框架适用于任何多变量时间序列数据,可推广到金融、气候等领域
局限与展望¶
- 概念验证阶段:仅在 5 区域的 NetSim 合成数据上验证,未在真实 fMRI 数据上测试,也未执行任何下游学习任务(如分类、解码),无法判断构建出的 CC 是否真的有用
- 固定阈值策略:S-信息和 O-信息的阈值(0.45 和 \(\lesssim 0\))是基于探索性实验确定的,可能不适用于其他数据集。需要自适应标准、统计检验和超越高斯假设的鲁棒估计器
- 组合爆炸:候选 rank-\(k\) 单元数量为 \(\binom{N}{k+1}\),标准脑图谱 \(N \approx 100\) 时已不可行。作者提到了局部敏感哈希、Kalman 过滤、相似性预选等缓解策略但均未实现
- 脑区定义依赖:结果可能强烈依赖于脑区的划分方式(ICA vs 解剖分区),这是高阶网络建模的共性问题
- 高斯估计器局限:JIDT 使用高斯估计器计算信息论度量,对真实 fMRI 数据的非高斯分布可能不准确
相关工作与启发¶
- vs 持续同调/Betti 数方法:这些 TDA 方法关注全局拓扑不变量,基于几何/距离过滤,而本文基于统计依赖。两者互补——持续同调捕获全局形状特征,CC 捕获局部高阶交互模式
- vs 超图方法:超图也能表示高阶关系,但没有秩函数提供的层次结构,且通常不区分协同和冗余交互
- vs TopoBench (Telyatnikov 2025):TopoBench 提供了 TDL 架构的标准化评测平台,本文的 CC 构建管线可以直接与之集成,为脑网络数据上的 CCNN 评测奠定基础
评分¶
- 新颖性: ⭐⭐⭐⭐ 首次将信息论与组合复形直接结合用于脑网络分析,跳过拓扑提升步骤的思路新颖
- 实验充分度: ⭐⭐ 仅为概念验证,无真实数据、无下游任务、无与其他方法的定量对比
- 写作质量: ⭐⭐⭐⭐ 数学框架清晰,动机阐述到位,pipeline 描述详细
- 价值: ⭐⭐⭐ 方向前沿但距实际应用尚远,需要大量后续工作验证可行性
相关论文¶
- [NeurIPS 2025] Brain-tuning Improves Generalizability and Efficiency of Brain Alignment in Speech Models
- [ICML 2025] CFP-Gen: Combinatorial Functional Protein Generation via Diffusion Language Models
- [CVPR 2025] SapiensID: Foundation for Human Recognition
- [NeurIPS 2025] DesignX: Human-Competitive Algorithm Designer for Black-Box Optimization
- [NeurIPS 2025] Meta-Learning an In-Context Transformer Model of Human Higher Visual Cortex