跳转至

Induce, Align, Predict: Zero-Shot Stance Detection via Cognitive Inductive Reasoning

会议: AAAI 2026
arXiv: 2506.13470
代码: 无
领域: NLP理解 / 立场检测
关键词: 零样本立场检测, 认知推理, 一阶逻辑, 图核模型, schema

一句话总结

提出CIRF(Cognitive Inductive Reasoning Framework),受认知科学启发,从原始文本中无监督归纳一阶逻辑推理模式(schema),构建多关系schema图,用图核模型对齐输入与schema模板实现可解释的零样本立场推理,在SemEval-2016、VAST和COVID-19-Stance上达到SOTA,仅30%数据即可匹配全量。

研究背景与动机

  1. 领域现状:零样本立场检测(ZSSD)需要对未见目标判断文本立场。LLM零样本能力和LLM增强方法是两大方向。
  2. 现有痛点:(a) LLM提示在复杂推理上不足,泛化差;(b) LLM增强方法需大量标注,停留在实例级模式。
  3. 核心矛盾:立场检测需要跨目标的抽象推理,但现有方法要么surface-level匹配要么过度依赖标注。
  4. 本文要解决什么? 无监督归纳抽象推理模式,实现可解释的零样本立场推理。
  5. 切入角度:认知科学中的schema理论——人类从具体经验归纳推理模式并应用到新情境。
  6. 核心idea一句话:无监督归纳一阶逻辑模式为多关系schema图,通过图核对齐实现可解释零样本推理。

方法详解

整体框架

输入:文本+目标。输出:立场。Pipeline:文本→一阶逻辑→聚类为schema图→图核对齐→立场。

关键设计

  1. Schema归纳(Induce)
  2. 做什么:从文本无监督归纳抽象推理模式
  3. 核心思路:文本→一阶逻辑表示→聚类为多关系schema图
  4. 设计动机:schema跨目标可迁移

  5. 结构对齐(Align)

  6. 做什么:用图核度量输入图和schema图的结构相似度
  7. 设计动机:可解释的结构匹配

  8. 立场预测(Predict)

  9. 做什么:基于最匹配schema推理立场

损失函数 / 训练策略

Schema归纳为无监督,图核匹配不需目标特定标注。

实验关键数据

主实验

数据集 CIRF 说明
SemEval-2016 SOTA 新最优
VAST SOTA 新最优
COVID-19-Stance SOTA 新最优
30%数据 ≈全量 强低资源泛化

关键发现

  • 三基准SOTA,30%数据匹配全量方法
  • 可解释性:schema图提供清晰推理路径
  • Schema具有跨目标可迁移性

亮点与洞察

  • 认知科学→NLP成功迁移:schema概念引入立场检测,提供超越表面匹配的抽象推理能力。
  • 30%数据匹配全量:证明归纳的schema捕获了可迁移的推理结构。
  • 可解释性:图结构匹配比黑盒LLM更透明。

局限性 / 可改进方向

  • 论文全文不可用,详细消融数据未获取
  • Schema归纳质量可能随文本域变化
  • 一阶逻辑可能无法捕获修辞和隐喻

相关工作与启发

  • vs LLM零样本提示:CIRF通过schema提供结构化推理
  • vs 传统ZSSD:CIRF的schema跨目标可迁移,不需目标特定特征

评分

  • 新颖性: ⭐⭐⭐⭐ 认知归纳推理schema引入零样本立场检测是新颖的跨领域结合
  • 实验充分度: ⭐⭐⭐⭐ 三个基准数据集上达到SOTA,低资源场景也有验证
  • 写作质量: ⭐⭐⭐⭐ 从认知科学到NLP方法的动机推导清晰
  • 价值: ⭐⭐⭐⭐ 低资源零样本立场检测的实用方法,schema的跨目标迁移性有重要价值