Beyond Dialogue: A Profile-Dialogue Alignment Framework Towards General Role-Playing Language Model¶

会议: ACL 2025
arXiv: 2408.10903
代码: https://github.com/yuyouyu32/BeyondDialogue
领域: 对话
关键词: 角色扮演, 对话生成, 轮廓对齐, 细粒度, LLM

一句话总结¶

本文提出Beyond Dialogue框架，通过引入"超越对话"任务实现角色轮廓与场景对话的句级细粒度对齐，解决了角色扮演训练中预定义角色轮廓与具体场景对话之间的偏差问题，在角色忠实度上超越GPT-4o和专用角色扮演基线。

领域现状：角色扮演LLM智能体（如Character AI）能模拟各种角色进行交互，但开源通用角色扮演模型的发展仍受限。
现有痛点：(1)偏差问题——预定义角色轮廓（如"博学的、鼓励性的"）通常从整部小说提取，但单个场景的对话只体现部分特征，导致轮廓与训练对话不匹配甚至矛盾。(2)对齐粗粒度——模型只学到从轮廓到对话的模糊映射，缺乏句级细粒度对齐。
核心矛盾：83.2%的HPD数据集场景存在轮廓-对话偏差，这种偏差会误导模型学习错误的角色表现。
本文目标：消除训练偏差，实现句级细粒度的角色特征-对话对齐。
切入角度：像演员学角色一样——理解各个角色特征如何在不同场景中具体表现。
核心idea：用LLM提示机制对齐场景对话与角色轮廓 + 生成细粒度推理数据进行训练。

角色轮廓 + 场景对话 → LLM对齐（消除偏差特征、标注句级映射）→ 生成"超越对话"任务数据 → 训练角色扮演模型 → 客观化评估流水线。

轮廓-对话对齐机制:
- 功能：消除每个场景中预定义轮廓与实际对话间的偏差。
- 核心思路：对每个场景，使用LLM分析哪些轮廓特征实际体现在对话中，哪些没有。只保留场景对话中实际体现的特征进行训练，消除不匹配的特征带来的误导。同时为每句对话标注对应的角色特征。
- 设计动机：83.2%的场景存在偏差，直接使用全轮廓训练会误导模型。
句级细粒度对齐任务:
- 功能：让模型学会"这句话体现了什么角色特征"，实现特征到对话的精确映射。
- 核心思路：通过LLM提示机制为每句角色对话生成推理数据——"这句话体现了角色的[博学]特征，因为[使用了学术术语并引用了文献]"。这些推理数据作为额外训练任务（"beyond dialogue" tasks），直接建立轮廓属性和对话句子的连接。
- 设计动机：传统对话训练只学输入→输出的映射，缺乏"为什么这样说"的解释性对齐。
客观化评估流水线:
- 功能：将主观评估转化为客观可量化的评估。
- 核心思路：将所有评估任务转化为客观题（选择题和判断题），以模型是否忠实于用户定义的角色轮廓为评估标准。结合自动对话生成和"LLMs as Judges"方法。
- 设计动机：传统主观评估（人类打分或LLM打分）结果不一致且不可复现。

标准SFT训练，在原始对话任务基础上加入对齐推理任务。应用于Qwen2和Mistral-Nemo双语基线。全自动低成本数据构建流程。

模型	角色忠实度	对话质量	说明
GPT-4o	82.3	高	强基线
Baichuan-NPC-Turbo	79.1	高	专用角色扮演
Beyond Dialogue (Qwen2)	85.7	高	超越GPT-4o
无对齐基线	71.5	中	偏差影响明显