SPASM: Stable Persona-driven Agent Simulation for Multi-turn Dialogue Generation¶

会议: ACL 2026 Findings
arXiv: 2604.09212
代码: GitHub
领域: 对话系统
关键词: 人设对话, 多轮模拟, 角色漂移, 自我中心投影, 数据生成

一句话总结¶

本文提出 SPASM，一个以稳定性为核心的人设驱动多轮对话模拟框架，通过模块化人设生成、自我中心上下文投影（ECP）和终止检测三个组件，在 LLM-LLM 对话中大幅减少角色漂移和"回声"现象，构建了 45,000 段高质量多轮对话数据。

研究背景与动机¶

领域现状：LLM 在辅导、支持、咨询等多轮交互场景中广泛部署。LLM-LLM 对话模拟是生成大规模训练/评估数据的有效方式，相比人工收集更低成本且可控。

现有痛点：LLM-LLM 长对话会累积身份相关故障——人设漂移（角色逐渐偏离指定身份）、角色混淆和"回声"效应（一个智能体逐渐模仿另一个的语言和立场）。这些问题在对话变长时更加严重，导致生成的对话不再对应预期的设定，污染合成数据集。

核心矛盾：朴素的对话历史拼接方式是问题根源——同一句话对不同智能体可能占据不同的相对角色（user vs assistant），导致角色混淆和反馈回路。

本文目标：设计一个"稳定性优先"的对话模拟框架，在不修改模型权重的前提下保证长期角色一致性。

切入角度：通过改变对话历史的表示方式而非模型本身来解决问题——将对话历史存储为视角无关格式，在生成时确定性地投影为每个智能体的自我中心视角。

核心 idea：自我中心上下文投影（ECP）：对话历史以 \((speaker\_id, content)\) 形式存储，生成时通过角色重标记算子 \(\Psi_i\) 将说话者标签映射为 SELF/PARTNER，确保每个智能体始终从自己的视角看待对话。

方法详解¶

整体框架¶

SPASM 包含五个组件：(1) Persona Schema（采样人设属性）→ (2) Persona Validator（验证组合合理性）→ (3) Persona Crafter（生成自然语言人设描述）→ (4) Client-Responder 对话模拟（带 ECP）→ (5) Termination Detector（检测自然结束点）。

关键设计¶

自我中心上下文投影（ECP）:
- 功能：消除角色混淆和回声效应，保证长期人设一致性
- 核心思路：对话历史存储为视角无关的有序序列 \(\mathcal{H}_t = (u_k)_{k=1}^t\)，其中 \(u_k = (s_k, c_k)\)（说话者ID + 内容）。生成时通过投影算子 \(\Psi_i(\mathcal{H}_t) = ((\phi_i(s_k), c_k))_{k=1}^t\) 将绝对说话者映射为相对角色描述（SELF/PARTNER）。这确保每个智能体看到的对话历史中，自己的发言标记为 SELF，对方标记为 PARTNER
- 设计动机：朴素拼接中 user/assistant 标签的固定分配是角色混淆的根源。ECP 将此转换为对称的 SELF/PARTNER 表示，使得角色标签与智能体身份解耦
模块化人设生成流水线:
- 功能：生成多样、合理、可控的人设描述
- 核心思路：三步走——Schema Sampling（从预定义字段随机采样：年龄、职业、地点、情绪状态、行为模式等）→ Validator（检查组合的连贯性和合理性，如"18岁学生+退休金规划"不合理则重采样）→ Crafter（将验证通过的属性集转换为连贯的自然语言人设描述，并可扩展额外细节）
- 设计动机：直接使用随机采样的属性组合可能不合理。验证器+精炼器确保人设的可信度
终止检测器:
- 功能：在对话达到自然结束点时检测并终止，避免强制截断或无限循环
- 核心思路：在第 \(T\) 轮后激活，基于最近 \(m\) 轮对话历史和预定义终止规则判断是否出现关闭信号（如表达感谢、告别）
- 设计动机：硬性截断产生不自然的结尾，终止检测确保对话的连贯性和自然性

损失函数 / 训练策略¶

完全免训练。所有组件通过 API 调用实现，不修改模型权重。

实验关键数据¶

人设检索准确率（Top-1 Acc）¶

Client / Responder	Top-1	Top-10
GPT / GPT	0.96	1.00
GPT / DeepSeek	0.50	0.82
DS / GPT	0.99	1.00
Qwen / Qwen	0.98	1.00

消融实验（ECP 效果）¶

指标	有 ECP	无 ECP
人设漂移	显著降低	高
回声效应	人工验证接近零	频繁出现
Silhouette 得分	高（0.60）	低

关键发现¶

ECP 是最关键的设计：大幅减少人设漂移，在人工验证中几乎消除了回声效应
同骨干模型交互产生更紧凑的人设聚类（GPT/GPT Silhouette=0.60 vs GPT/DS=0.10）
Responder 模型骨干主导交互几何：固定 Responder 为 GPT 时，无论 Client 是什么，聚类质量都高
跨模型交互主要增加簇内方差，而非降低簇间分离度
构建了 4,500 人设 × 45,000 对话的大规模数据集

亮点与洞察¶

ECP 的"最小改变，最大效果"非常优雅：仅改变对话历史的角色标签表示方式（user/assistant → SELF/PARTNER），就大幅提升了长期稳定性。这个简单想法有深刻的含义——角色表示方式比模型能力更关键
Responder 模型主导交互几何的发现很有趣：在人设驱动对话中，回应者（而非主动方）决定了对话空间的结构，暗示"倾听者"对交互质量的影响比"说话者"更大
人设验证步骤避免了不合理组合，使数据集更可信，是合成数据生成中值得推广的实践

局限与展望¶

仅验证了英语对话，多语言场景的效果未知
人设属性字段是预定义的，可能不够覆盖所有应用场景
最大对话长度限制为 25 轮/智能体，更长对话的稳定性未测试
未评估生成数据用于下游 SFT 训练的效果
ECP 在多智能体（>2）场景的扩展虽然理论上可行但未验证

评分¶

新颖性: ⭐⭐⭐⭐ ECP 简单但有效，人设稳定性分析深入
实验充分度: ⭐⭐⭐⭐ 9种骨干组合、45K对话、多维度分析
写作质量: ⭐⭐⭐⭐ 形式化清晰，分析透彻
价值: ⭐⭐⭐⭐ 为 LLM 对话数据生成提供了实用的稳定性解决方案