Nonparametric Identification of Latent Concepts¶
会议: ICML2025
arXiv: 2510.00136
代码: 待确认
领域: 概念学习
关键词: 概念学习, 可识别性, 非参数, 潜在变量, 解耦表示学习
一句话总结¶
提出首个非参数概念可识别性理论框架,证明在不假设概念类型、函数关系或参数生成模型的情况下,仅通过多类别观测的多样性即可识别隐藏概念(至逐元素变换+置换不确定性)。
研究背景与动机¶
人类天生具备通过比较不同类别的观察来学习概念的能力。例如儿童通过比较鲨鱼和海龟的差异来识别"捕食者"、"流线体型"、"贝壳"等特有概念。这一认知机制已被心理学和神经科学广泛验证。
机器学习中,从数据中提取概念对可解释性和泛化至关重要。已有大量经验性成功,但缺乏通用的理论保证:
- 线性假设:假设概念与表示线性相关,可识别至线性变换(Rajendran et al., 2024)
- 物体中心学习:假设无遮挡或加性生成过程(Brady et al., 2023; Lachapelle et al., 2023)
- 这些约束限制了对真实场景中经验成功的解释
核心问题:在通用设定下,哪些概念可以被可靠地恢复并获得理论保证?
方法详解¶
问题设定¶
观测变量 \(\mathbf{x} \in \mathbb{R}^m\) 由潜在概念 \(\mathbf{z} = (\mathbf{z}_A, \mathbf{z}_B) \in \mathbb{R}^n\) 通过未知微分同胚生成:
其中:
- \(\mathbf{z}_A\):类别相关概念,条件于观测类别变量 \(\mathbf{c}\)
- \(\mathbf{z}_B\):类别无关概念(如光照、温度)
- 条件独立性:\(p(\mathbf{z}|\mathbf{c}) = p(\mathbf{z}_A|\mathbf{c})p(\mathbf{z}_B)\)
- 连接结构 \(M\):二元邻接矩阵,编码类别与概念的依赖关系
定理1:局部比较学习(成对比较)¶
对于任意一对类别 \(\mathbf{c}_i\) 和 \(\mathbf{c}_j\),在温和的非退化样本空间条件下(Jacobian的支撑空间线性独立性),存在置换 \(\pi\) 使得各类别的独有概念与其他概念解耦:
推论1:推广至任意类别子集的局部比较,实现部分可识别性——即使全局条件不满足,只要局部有足够多样性,仍可识别尽可能多的概念。
定理2:全局比较学习¶
在结构多样性假设(Assumption 1)下,对每个类别相关概念 \(\mathbf{z}_i\),存在类别集合使其可与其他概念区分:
- 逐元素可识别性:\(\hat{\mathbf{z}}_i = h_i(\mathbf{z}_{\pi(i)})\),\(h_i\) 为可逆函数
- 块可识别性:类别无关部分 \(\hat{\mathbf{z}}_B = h(\mathbf{z}_B)\)
分布可变性条件仅需两个类别有不同条件分布,远少于先前工作要求的 \(2n_A+1\) 个域。
命题1:类别无关概念识别¶
在定理2基础上,通过对 \(\mathbf{z}_B\) 与 \(\mathbf{x}\) 之间连接结构的稀疏性条件,可非参数地识别所有概念。
命题2:结构恢复¶
隐藏的类别-概念连接结构 \(M\) 也可被恢复(至置换矩阵):\(\hat{M} = PM\),且不需要结构多样性假设。
估计方法¶
采用正则化最大似然估计:
其中 \(\mathbf{R}\) 为 \(\hat{M}\) 和 \(D_{\hat{\mathbf{z}}}\hat{f}\) 的 \(\ell_1\) 范数正则化。
实验关键数据¶
| 设定 | 数据集 | 指标 | Ours | Base |
|---|---|---|---|---|
| 类别相关概念 | 合成数据(不同概念数) | MCC | 高MCC + 低方差 | 低MCC + 高方差 |
| 全部概念 | 合成数据(不同概念数) | MCC | 显著优于Base | 无法解耦 |
| 真实数据 | Fashion-MNIST | 语义一致性 | 识别出袖长/躯干长/肩宽 | - |
| 真实数据 | AnimalFace | 语义一致性 | 识别出熊科/单色等概念 | - |
| 真实数据 | Flower102 | 跨环境鲁棒性 | 同一概念跨角度一致识别 | - |
关键发现:
- 满足结构多样性条件时,模型在合成数据上实现高MCC且低方差
- Base模型(无结构条件)无法解耦大部分概念
- 真实数据上识别的概念语义与人类理解一致
- Flower102上同一概念在不同环境/角度下可被一致识别
亮点与洞察¶
- 首个通用非参数框架:不限定概念类型(线性/加性/不相交),不假设参数生成模型,仅依赖类别间的结构多样性
- 局部→全局的灵活保证:Thm.1和Cor.1 实现部分可识别性,实际场景中全局条件难以满足时仍可提供尽可能多的保证
- 条件极为宽松:分布可变性仅需2个类别有差异(vs. 先前需 \(2n_A+1\) 个域);结构恢复甚至不需要结构多样性假设
- 认知启发:理论框架直接对应人类"通过比较学习概念"的认知机制,从成对比较到全局理解
- 跨领域影响:理论对解耦表示学习、因果表示学习、物体中心学习、结构学习均有启发
局限与展望¶
- 重叠概念场景:当所有类别的概念高度重叠(如所有犬种共享"吠叫""毛茸茸"),结构多样性不满足,仍需参数假设
- 理论→实践鸿沟:将理论框架推广到组合泛化、可控生成、决策制定等实际问题尚待探索
- 实验规模有限:真实数据实验主要为中小规模图像数据集,未验证在基础模型或大规模数据上的表现
- 估计方法依赖正则化超参:\(\lambda\) 和 \(\ell_1\) 正则化的选择缺乏理论指导
- 类别无关概念的识别需额外的 \(\mathbf{z}_B\)-\(\mathbf{x}\) 结构稀疏假设,通用性稍弱
相关工作与启发¶
- 线性概念识别:Rajendran et al. (2024), Reizinger et al. (2024) — 线性假设下识别至线性变换
- 物体中心学习:Brady et al. (2023), Lachapelle et al. (2023) — 需无遮挡/加性假设
- 非线性ICA:Hyvärinen & Morioka (2016), Khemakhem et al. (2020) — 需多域/辅助变量
- 结构学习:Shimizu et al. (2006), Zheng et al. (2022) — 从外生噪声恢复DAG
评分¶
- 新颖性: ⭐⭐⭐⭐⭐ — 首个非参数概念可识别性理论,局部比较的部分可识别性思路新颖
- 实验充分度: ⭐⭐⭐ — 合成实验验证理论,真实数据定性展示,但缺乏大规模定量评估
- 写作质量: ⭐⭐⭐⭐⭐ — 从认知科学到数学形式化的叙事流畅,例子丰富
- 价值: ⭐⭐⭐⭐ — 为概念学习的经验成功提供理论基础,跨领域影响广泛
相关论文¶
- [CVPR 2025] Memories of Forgotten Concepts
- [NeurIPS 2025] Emergence and Evolution of Interpretable Concepts in Diffusion Models
- [ICML 2025] Origin Identification for Text-Guided Image-to-Image Diffusion Models
- [NeurIPS 2025] When Are Concepts Erased From Diffusion Models?
- [CVPR 2025] FDeID-Toolbox: Face De-Identification Toolbox