Exploring Persona Sentiment Sensitivity in Personalized Dialogue Generation¶

会议: ACL 2025
arXiv: 2502.11423
代码: https://github.com/imsongpasimin/PesonaSensitivity
领域: 文本生成
关键词: 个性化对话, 人设情感, LLM敏感性, 对话质量, 情感感知提示

一句话总结¶

大规模分析 LLM 对人设情感极性的敏感性，发现负面人设导致过度强调人设属性和对话矛盾、弱/中性人设产生低质量对话，提出结合逐轮生成、人设排序和情感感知提示的对话生成框架来缓解这些问题。

领域现状：个性化对话系统通过将用户人设嵌入 LLM 的系统提示来生成个性化回复，已取得显著进展。
现有痛点：LLM 对上下文情感极性高度敏感，但人设情感如何影响对话质量研究不足。直觉上，负面人设（如"我讨厌运动"）应该和正面人设一样容易嵌入对话，但实际并非如此。
核心矛盾：负面人设对话倾向于过度强调人设属性（如反复提到"我讨厌…"），正面人设则能选择性融入——LLM 处理正负情感的能力不对称。
本文要解决什么？ 系统分析人设情感极性对对话质量的影响机制，并提出缓解策略。
切入角度：构造极性化的人设 profile（纯正面/纯负面/混合），大量生成对话后用多种指标分析。
核心idea一句话：LLM 对负面人设过度敏感，需要情感感知的对话生成策略来平衡。

基于 ConvAI2 数据集，用情感分类器提取极性化人设句子（置信度>0.99），组合为正面/负面/混合 profile各 10K 个，用 LLM 生成大量对话后分析质量差异。针对发现的问题，提出三组件框架。

极性化人设构造:
做什么：构建不同情感极性的用户画像
核心思路：用 DistilBERT 情感分类器筛选 ConvAI2 中的人设句子——2691 正面、1006 负面、2429 中性。组合时用 NLI 模型检测矛盾，确保同一 profile 内无冲突
关键发现：17% 的人设天然是负面的——这不是人为构造的极端场景
大规模对话分析:
做什么：量化不同极性人设对对话质量的影响
核心发现：
- 负面人设对话：人设属性过度出现、矛盾增多、连贯性下降
- 正面人设对话：选择性融入人设、对话自然流畅
- 弱/中性人设：对话质量最低——模型不确定如何处理中性信息
情感感知对话生成框架:
逐轮生成策略: 逐轮交替生成用户和系统回复，而非一次性生成整段对话
Profile排序机制: 将中性/弱情感人设放在对话早期，正面人设放在后期——先建立基础再融入亮点
情感感知提示: 在提示中明确指示"注意负面或中性情感的人设，避免过度强调"
设计动机：综合缓解负面人设过度强调和弱人设低质量的问题

对话类型	人设出现率	矛盾率	连贯性
正面+正面	适中	低	高
负面+负面	过高	高	低
弱+弱	低	中	最低
混合	中	中	中