跳转至

Simulating Society Requires Simulating Thought

会议: NeurIPS 2025
arXiv: 2506.06958
代码: 无
领域: LLM推理 / Agent / 社会模拟
关键词: 社会模拟, 认知建模, 因果推理, 信念图, 推理保真度

一句话总结

本文提出从"行为主义"模式转向"认知建模"范式,通过 GenMinds 框架用因果信念图建模 LLM Agent 的内部推理过程,并设计 RECAP 基准从可追溯性、人口统计敏感性和干预一致性三维度评估推理保真度。

研究背景与动机

  1. 领域现状:LLM 越来越多地用于社会模拟。当前主流做法通过 persona prompting 或 RLHF 让 Agent 生成看起来像人的回答。

  2. 现有痛点:现有方法停留在行为主义范式。Agent 输出流畅但内部缺乏因果推理、信念追溯和反事实推理能力。三个核心失败:推理不可追溯、反事实不敏感、共识幻觉。

  3. 核心矛盾:输出层面的表面对齐不等于推理层面的结构对齐。自回归架构优化 next-token likelihood 而非 belief-state transitions。

  4. 本文要解决什么? 让社会模拟中的 LLM Agent 具备结构化、可修正、可追溯的信念推理能力。

  5. 切入角度:从认知科学出发,人类推理具备因果性、组合性、可修正性三个核心特征。

  6. 核心idea一句话:用认知科学启发的因果信念图替代 token 级生成,让 Agent 模拟思维而不仅是模拟语言。

方法详解

整体框架

本文提出 GenMinds(建模框架)和 RECAP(评估框架)。Pipeline:自然语言访谈 → LLM 解析 → 认知母题提取 → 因果贝叶斯网络构建 → 符号-神经混合推理 → 信念传播与干预模拟。

关键设计

  1. 认知母题(Cognitive Motifs):
  2. 做什么:从自然语言中提取最小因果推理单元
  3. 核心思路:对访谈进行 LLM 辅助解析,识别概念节点和定向因果关系。跨个体聚合形成共享认知母题拓扑
  4. 设计动机:模块化可复用的推理单元支持跨域泛化

  5. 因果信念网络(CBN):

  6. 做什么:将认知母题编译成有向无环图
  7. 核心思路:节点编码概念,边编码方向性因果影响,支持 do-calculus 进行反事实干预模拟
  8. 设计动机:显式因果图使推理路径可追溯、可解释

  9. 符号-神经混合推理:

  10. 做什么:结合 LLM 灵活性和符号推理严谨性
  11. 核心思路:LLM 选择干预并组装母题到 CBN,用概率更新模拟信念变化

  12. RECAP 评估框架:

  13. 三维度:母题对齐、信念一致性、反事实鲁棒性

实验关键数据

概念验证

场景 干预 变量 干预前 干预后
城市监控 do(Transparency=high) Privacy Concern 0.7 0.3
城市监控 do(Transparency=high) Opposition 0.7 0.2

范式对比

维度 现有范式 GenMinds
推理格式 Token级生成 结构化信念图
信念动态 静态或重置 因果更新可修正
评估视角 输出流畅度 推理保真度
社会表征 平均化扁平化 多样化位置性认知

关键发现

  • CoT 性能在分布偏移下坍塌
  • 多Agent系统中行为趋同产生共识幻觉
  • 人口统计条件化产生身份扁平化

亮点与洞察

  • 从行为主义到认知主义的范式转换视角可迁移到很多 LLM 评估场景
  • 认知母题概念巧妙地将推理分解为最小可复用因果单元
  • "有结构的不一致"vs"无结构的不一致"区分点很有价值

局限性 / 可改进方向

  • 缺乏实证验证,仅概念设计和示例
  • 因果图构建面临概念歧义等难题
  • 人类推理不仅有因果推理,还有联想、类比等
  • 半结构化访谈数据获取成本高

相关工作与启发

  • vs Generative Agents: 仍是输出导向,本文批评其产生平均群体行为
  • vs CoT/ReAct: 本文论证这些是后验合理化
  • vs RLHF: 优化行为对齐而非认知对齐

评分

  • 新颖性: ⭐⭐⭐⭐ 认知科学视角有 originality
  • 实验充分度: ⭐⭐ 没有定量实验
  • 写作质量: ⭐⭐⭐⭐⭐ 论证清晰
  • 价值: ⭐⭐⭐⭐ 范式转换有长远影响