跳转至

Nonparametric Identification of Latent Concepts

会议: ICML2025
arXiv: 2510.00136
代码: 待确认
领域: 概念学习
关键词: 概念学习, 可识别性, 非参数, 潜在变量, 解耦表示学习

一句话总结

提出首个非参数概念可识别性理论框架,证明在不假设概念类型、函数关系或参数生成模型的情况下,仅通过多类别观测的多样性即可识别隐藏概念(至逐元素变换+置换不确定性)。

研究背景与动机

人类天生具备通过比较不同类别的观察来学习概念的能力。例如儿童通过比较鲨鱼和海龟的差异来识别"捕食者"、"流线体型"、"贝壳"等特有概念。这一认知机制已被心理学和神经科学广泛验证。

机器学习中,从数据中提取概念对可解释性和泛化至关重要。已有大量经验性成功,但缺乏通用的理论保证

  • 线性假设:假设概念与表示线性相关,可识别至线性变换(Rajendran et al., 2024)
  • 物体中心学习:假设无遮挡或加性生成过程(Brady et al., 2023; Lachapelle et al., 2023)
  • 这些约束限制了对真实场景中经验成功的解释

核心问题:在通用设定下,哪些概念可以被可靠地恢复并获得理论保证?

方法详解

问题设定

观测变量 \(\mathbf{x} \in \mathbb{R}^m\) 由潜在概念 \(\mathbf{z} = (\mathbf{z}_A, \mathbf{z}_B) \in \mathbb{R}^n\) 通过未知微分同胚生成:

\[\mathbf{x} \coloneqq f(\mathbf{z})\]

其中:

  • \(\mathbf{z}_A\):类别相关概念,条件于观测类别变量 \(\mathbf{c}\)
  • \(\mathbf{z}_B\):类别无关概念(如光照、温度)
  • 条件独立性:\(p(\mathbf{z}|\mathbf{c}) = p(\mathbf{z}_A|\mathbf{c})p(\mathbf{z}_B)\)
  • 连接结构 \(M\):二元邻接矩阵,编码类别与概念的依赖关系
\[p(\mathbf{z}_A|\mathbf{c}) = \prod_{i=1}^{n_A} p(\mathbf{z}_i | M_{i,\cdot} \odot \mathbf{c})\]

定理1:局部比较学习(成对比较)

对于任意一对类别 \(\mathbf{c}_i\)\(\mathbf{c}_j\),在温和的非退化样本空间条件下(Jacobian的支撑空间线性独立性),存在置换 \(\pi\) 使得各类别的独有概念与其他概念解耦

\[\frac{\partial \hat{\mathbf{z}}_{\pi(A_i \setminus A_j)}}{\partial \mathbf{z}_{A_j}} = 0, \quad \frac{\partial \hat{\mathbf{z}}_{\pi(A_j \setminus A_i)}}{\partial \mathbf{z}_{A_i}} = 0\]

推论1:推广至任意类别子集的局部比较,实现部分可识别性——即使全局条件不满足,只要局部有足够多样性,仍可识别尽可能多的概念。

定理2:全局比较学习

结构多样性假设(Assumption 1)下,对每个类别相关概念 \(\mathbf{z}_i\),存在类别集合使其可与其他概念区分:

  • 逐元素可识别性\(\hat{\mathbf{z}}_i = h_i(\mathbf{z}_{\pi(i)})\)\(h_i\) 为可逆函数
  • 块可识别性:类别无关部分 \(\hat{\mathbf{z}}_B = h(\mathbf{z}_B)\)

分布可变性条件仅需两个类别有不同条件分布,远少于先前工作要求的 \(2n_A+1\) 个域。

命题1:类别无关概念识别

在定理2基础上,通过对 \(\mathbf{z}_B\)\(\mathbf{x}\) 之间连接结构的稀疏性条件,可非参数地识别所有概念。

命题2:结构恢复

隐藏的类别-概念连接结构 \(M\) 也可被恢复(至置换矩阵):\(\hat{M} = PM\),且不需要结构多样性假设

估计方法

采用正则化最大似然估计:

\[\mathcal{L}(\theta) = \mathbb{E}_{(\mathbf{x},\mathbf{c})} \left[ -\log p_{\hat{f}^{-1}}(\mathbf{x} | \mathcal{M}_{i,:} \odot \mathbf{c}) + \lambda \mathbf{R} \right]\]

其中 \(\mathbf{R}\)\(\hat{M}\)\(D_{\hat{\mathbf{z}}}\hat{f}\)\(\ell_1\) 范数正则化。

实验关键数据

设定 数据集 指标 Ours Base
类别相关概念 合成数据(不同概念数) MCC 高MCC + 低方差 低MCC + 高方差
全部概念 合成数据(不同概念数) MCC 显著优于Base 无法解耦
真实数据 Fashion-MNIST 语义一致性 识别出袖长/躯干长/肩宽 -
真实数据 AnimalFace 语义一致性 识别出熊科/单色等概念 -
真实数据 Flower102 跨环境鲁棒性 同一概念跨角度一致识别 -

关键发现

  • 满足结构多样性条件时,模型在合成数据上实现高MCC且低方差
  • Base模型(无结构条件)无法解耦大部分概念
  • 真实数据上识别的概念语义与人类理解一致
  • Flower102上同一概念在不同环境/角度下可被一致识别

亮点与洞察

  1. 首个通用非参数框架:不限定概念类型(线性/加性/不相交),不假设参数生成模型,仅依赖类别间的结构多样性
  2. 局部→全局的灵活保证:Thm.1和Cor.1 实现部分可识别性,实际场景中全局条件难以满足时仍可提供尽可能多的保证
  3. 条件极为宽松:分布可变性仅需2个类别有差异(vs. 先前需 \(2n_A+1\) 个域);结构恢复甚至不需要结构多样性假设
  4. 认知启发:理论框架直接对应人类"通过比较学习概念"的认知机制,从成对比较到全局理解
  5. 跨领域影响:理论对解耦表示学习、因果表示学习、物体中心学习、结构学习均有启发

局限与展望

  1. 重叠概念场景:当所有类别的概念高度重叠(如所有犬种共享"吠叫""毛茸茸"),结构多样性不满足,仍需参数假设
  2. 理论→实践鸿沟:将理论框架推广到组合泛化、可控生成、决策制定等实际问题尚待探索
  3. 实验规模有限:真实数据实验主要为中小规模图像数据集,未验证在基础模型或大规模数据上的表现
  4. 估计方法依赖正则化超参\(\lambda\)\(\ell_1\) 正则化的选择缺乏理论指导
  5. 类别无关概念的识别需额外的 \(\mathbf{z}_B\)-\(\mathbf{x}\) 结构稀疏假设,通用性稍弱

相关工作与启发

  • 线性概念识别:Rajendran et al. (2024), Reizinger et al. (2024) — 线性假设下识别至线性变换
  • 物体中心学习:Brady et al. (2023), Lachapelle et al. (2023) — 需无遮挡/加性假设
  • 非线性ICA:Hyvärinen & Morioka (2016), Khemakhem et al. (2020) — 需多域/辅助变量
  • 结构学习:Shimizu et al. (2006), Zheng et al. (2022) — 从外生噪声恢复DAG

评分

  • 新颖性: ⭐⭐⭐⭐⭐ — 首个非参数概念可识别性理论,局部比较的部分可识别性思路新颖
  • 实验充分度: ⭐⭐⭐ — 合成实验验证理论,真实数据定性展示,但缺乏大规模定量评估
  • 写作质量: ⭐⭐⭐⭐⭐ — 从认知科学到数学形式化的叙事流畅,例子丰富
  • 价值: ⭐⭐⭐⭐ — 为概念学习的经验成功提供理论基础,跨领域影响广泛

相关论文