Towards Enhanced Immersion and Agency for LLM-based Interactive Drama¶

会议: ACL 2025
arXiv: 2502.17878
代码: GitHub
领域: LLM NLP
关键词: 交互式戏剧, 沉浸感, 代理感, 剧本生成, 角色扮演Agent

一句话总结¶

提出沉浸感-代理感（Immersion-Agency）范式来理解LLM交互式戏剧，并设计Playwriting-guided Generation和Plot-based Reflection两种方法分别增强故事生成质量和玩家对故事的影响力。

LLM交互式戏剧是一种新型的AI对话应用场景：玩家扮演故事中的角色，与LLM Agent扮演的其他角色对话互动，体验展开的故事。然而现有工作存在以下不足：

缺乏理论框架：之前的工作主要关注通用架构设计，未深入探讨交互体验的核心维度。本文引入经典交互叙事理论中的两个关键概念——沉浸感（Immersion，玩家融入故事的感觉）和代理感（Agency，玩家影响故事世界的能力）。
故事生成质量不足：LLM虽然在预训练阶段接触了大量文学作品，但微调过程缺乏对戏剧创作技巧的强调，导致生成的故事缺乏基本的戏剧结构和引人入胜的冲突。实验显示，GPT-4o和Qwen2.5-72b在无显式提示下几乎不使用任何叙事技巧。
角色代理感被忽视：之前的角色Agent构建很少考虑玩家行为如何有意义地影响角色反应和故事走向。

系统分为两大模块：(1) 剧本生成——通过 Playwriting-guided Generation 从玩家提供的前提段落生成高质量戏剧故事（含剧情结构、叙事技巧）；(2) 角色Agent——通过 Plot-based Reflection 让NPC根据玩家行为动态调整剧情链，增强代理感。

Playwriting-guided Generation（剧本引导生成）：
- 定义8种经典戏剧情境（如爱情、凤凰涅槃、灰姑娘、复仇等），基于亚里士多德三幕结构（设定、对抗、解决）描述。
- 总结6种微观叙事技巧（悬念、反转、非线性叙事、多重叙事、讽刺、象征）。
- 生成流程：采样1种戏剧情境+3种叙事技巧 → Writer LLM生成故事 → Critic LLM评审并给出改进建议 → Writer修改 → 重复3次选最佳 → 渐进式细节打磨。
- 效果：叙事技巧使用率从基线的6-12%提升到28-74%（以GPT-4o为基础）。
Plot-based Reflection（基于剧情的反思）：
- 角色Agent每隔k=5个交互步执行一次反思，分析玩家行为（情感、意图）的记忆，动态调整剧情链。
- 每次反思限制为调整不超过1个未完成剧情或插入不超过1个新剧情，防止LLM过度修改导致剧情不连贯。
- 使角色展现由玩家行为驱动的有意义的反应转变，如泄露秘密、提供陪伴、按特定方式推进剧情。
混合Agent架构（Hybrid Architecture）：
- Director-Actor架构：导演Agent全局协调+独立Actor Agent各自扮演角色，适合强互动场景。
- One-for-All架构：单一全局Agent扮演所有角色，效率更高，适合叙事为主的场景。
- 混合方案根据场景特征动态切换两种架构，平衡性能与效率（推理加速1.49倍）。

本文不涉及模型训练，所有Agent基于GPT-4o的提示工程。关键策略包括： - Sampling-Critic-Revise循环确保戏剧技巧正确应用 - 渐进式生成（从粗到细添加细节） - 记忆系统保留所有对话历史在prompt中

故事生成评估（50个前提段落，人类标注者评估胜率）：

方法	冲突（最佳↑/最差↓）	悬念	情感张力	角色弧	技巧遵循率
Outline-First	18%/34%	10%/28%	10%/50%	18%/36%	-
Playwriting-Guided	32%/24%	32%/22%	48%/16%	34%/20%	92%
w/o Critic & Revise	24%/24%	26%/34%	18%/28%	12%/32%	66%
w/o Refinement	26%/18%	32%/26%	24%/6%	36%/12%	-

角色Agent评估（5分制，手工剧本"车站七人"，10名人类+10名Agent玩家）：

架构	角色一致性	吸引力	叙事完整	进展	影响力	意图跟随	加速比
Director-Actor	3.9	4.2	3.8	3.6	4.2	3.9	1.00x
混合架构	4.1	3.9	4.3	4.3	4.0	4.0	1.49x
w/o Reflection	4.0	3.5	4.2	3.9	3.5	3.3	1.90x