Simulating Society Requires Simulating Thought¶

vs Generative Agents: 仍是输出导向，本文批评其产生平均群体行为
vs CoT/ReAct: 本文论证这些是后验合理化
vs RLHF: 优化行为对齐而非认知对齐

会议: NeurIPS 2025
arXiv: 2506.06958
代码: 无
领域: LLM推理 / Agent / 社会模拟
关键词: 社会模拟, 认知建模, 因果推理, 信念图, 推理保真度

一句话总结¶

本文提出从"行为主义"模式转向"认知建模"范式，通过 GenMinds 框架用因果信念图建模 LLM Agent 的内部推理过程，并设计 RECAP 基准从可追溯性、人口统计敏感性和干预一致性三维度评估推理保真度。

领域现状：LLM 越来越多地用于社会模拟。当前主流做法通过 persona prompting 或 RLHF 让 Agent 生成看起来像人的回答。
现有痛点：现有方法停留在行为主义范式。Agent 输出流畅但内部缺乏因果推理、信念追溯和反事实推理能力。三个核心失败：推理不可追溯、反事实不敏感、共识幻觉。
核心矛盾：输出层面的表面对齐不等于推理层面的结构对齐。自回归架构优化 next-token likelihood 而非 belief-state transitions。
本文要解决什么？ 让社会模拟中的 LLM Agent 具备结构化、可修正、可追溯的信念推理能力。
切入角度：从认知科学出发，人类推理具备因果性、组合性、可修正性三个核心特征。
核心idea一句话：用认知科学启发的因果信念图替代 token 级生成，让 Agent 模拟思维而不仅是模拟语言。

本文提出 GenMinds（建模框架）和 RECAP（评估框架）。Pipeline：自然语言访谈 → LLM 解析 → 认知母题提取 → 因果贝叶斯网络构建 → 符号-神经混合推理 → 信念传播与干预模拟。

场景	干预	变量	干预前	干预后
城市监控	do(Transparency=high)	Privacy Concern	0.7	0.3
城市监控	do(Transparency=high)	Opposition	0.7	0.2