Simulating Society Requires Simulating Thought¶
会议: NeurIPS 2025
arXiv: 2506.06958
代码: 无
领域: LLM推理 / Agent / 社会模拟
关键词: 社会模拟, 认知建模, 因果推理, 信念图, 推理保真度
一句话总结¶
本文提出从"行为主义"模式转向"认知建模"范式,通过 GenMinds 框架用因果信念图建模 LLM Agent 的内部推理过程,并设计 RECAP 基准从可追溯性、人口统计敏感性和干预一致性三维度评估推理保真度。
研究背景与动机¶
-
领域现状:LLM 越来越多地用于社会模拟。当前主流做法通过 persona prompting 或 RLHF 让 Agent 生成看起来像人的回答。
-
现有痛点:现有方法停留在行为主义范式。Agent 输出流畅但内部缺乏因果推理、信念追溯和反事实推理能力。三个核心失败:推理不可追溯、反事实不敏感、共识幻觉。
-
核心矛盾:输出层面的表面对齐不等于推理层面的结构对齐。自回归架构优化 next-token likelihood 而非 belief-state transitions。
-
本文要解决什么? 让社会模拟中的 LLM Agent 具备结构化、可修正、可追溯的信念推理能力。
-
切入角度:从认知科学出发,人类推理具备因果性、组合性、可修正性三个核心特征。
-
核心idea一句话:用认知科学启发的因果信念图替代 token 级生成,让 Agent 模拟思维而不仅是模拟语言。
方法详解¶
整体框架¶
本文提出 GenMinds(建模框架)和 RECAP(评估框架)。Pipeline:自然语言访谈 → LLM 解析 → 认知母题提取 → 因果贝叶斯网络构建 → 符号-神经混合推理 → 信念传播与干预模拟。
关键设计¶
- 认知母题(Cognitive Motifs):
- 做什么:从自然语言中提取最小因果推理单元
- 核心思路:对访谈进行 LLM 辅助解析,识别概念节点和定向因果关系。跨个体聚合形成共享认知母题拓扑
-
设计动机:模块化可复用的推理单元支持跨域泛化
-
因果信念网络(CBN):
- 做什么:将认知母题编译成有向无环图
- 核心思路:节点编码概念,边编码方向性因果影响,支持 do-calculus 进行反事实干预模拟
-
设计动机:显式因果图使推理路径可追溯、可解释
-
符号-神经混合推理:
- 做什么:结合 LLM 灵活性和符号推理严谨性
-
核心思路:LLM 选择干预并组装母题到 CBN,用概率更新模拟信念变化
-
RECAP 评估框架:
- 三维度:母题对齐、信念一致性、反事实鲁棒性
实验关键数据¶
概念验证¶
| 场景 | 干预 | 变量 | 干预前 | 干预后 |
|---|---|---|---|---|
| 城市监控 | do(Transparency=high) | Privacy Concern | 0.7 | 0.3 |
| 城市监控 | do(Transparency=high) | Opposition | 0.7 | 0.2 |
范式对比¶
| 维度 | 现有范式 | GenMinds |
|---|---|---|
| 推理格式 | Token级生成 | 结构化信念图 |
| 信念动态 | 静态或重置 | 因果更新可修正 |
| 评估视角 | 输出流畅度 | 推理保真度 |
| 社会表征 | 平均化扁平化 | 多样化位置性认知 |
关键发现¶
- CoT 性能在分布偏移下坍塌
- 多Agent系统中行为趋同产生共识幻觉
- 人口统计条件化产生身份扁平化
亮点与洞察¶
- 从行为主义到认知主义的范式转换视角可迁移到很多 LLM 评估场景
- 认知母题概念巧妙地将推理分解为最小可复用因果单元
- "有结构的不一致"vs"无结构的不一致"区分点很有价值
局限性 / 可改进方向¶
- 缺乏实证验证,仅概念设计和示例
- 因果图构建面临概念歧义等难题
- 人类推理不仅有因果推理,还有联想、类比等
- 半结构化访谈数据获取成本高
相关工作与启发¶
- vs Generative Agents: 仍是输出导向,本文批评其产生平均群体行为
- vs CoT/ReAct: 本文论证这些是后验合理化
- vs RLHF: 优化行为对齐而非认知对齐
评分¶
- 新颖性: ⭐⭐⭐⭐ 认知科学视角有 originality
- 实验充分度: ⭐⭐ 没有定量实验
- 写作质量: ⭐⭐⭐⭐⭐ 论证清晰
- 价值: ⭐⭐⭐⭐ 范式转换有长远影响