跳转至

Imperfectly Cooperative Human-AI Interactions: Comparing the Impacts of Human and AI Attributes in Simulated and User Studies

会议: ACL 2026
arXiv: 2604.15607
代码: 无
领域: 人机交互 / AI安全
关键词: 人机交互, 不完全合作, 个性特质, AI透明度, 模拟vs用户研究

一句话总结

通过 2000 次 LLM 模拟和 290 人用户研究的双框架实验,比较了人类个性特质和 AI 设计属性在不完全合作场景(招聘谈判、部分诚实交易)中的影响,发现模拟中个性特质主导而真人实验中 AI 透明度才是关键驱动因素。

研究背景与动机

领域现状:人机交互研究主要聚焦在人和 AI 共同追求目标的完全合作场景,对 AI 透明度、用户个体差异等因素的影响已有丰富研究。

现有痛点:(1) 现实 AI 部署越来越多涉及不完全合作场景(如 AI 招聘经理与求职者目标部分冲突,AI 客服可能隐瞒信息),这类场景研究不足;(2) 人类特质和 AI 属性通常被分开研究,联合效应未被探索;(3) LLM 模拟是否能代替真人实验验证结论存疑。

核心矛盾:模拟实验可以控制变量但可能不反映真实人类行为;真人实验成本高但更可靠。两者的结论是否一致?

本文目标:在不完全合作场景中,同时考察人类个性和 AI 属性的联合效应,并比较模拟与真人实验的差异。

切入角度:使用 Sotopia-S4 平台构建平行的模拟/用户研究,操纵外向性/宜人性(人类)和透明度/适应性/专业性/温暖/心智理论(AI),通过因果发现分析比较影响因子。

核心 idea:在不完全合作场景中,AI 属性(尤其是透明度)对真实用户的影响远大于模拟预测,凸显人在环验证的必要性。

方法详解

整体框架

两阶段实验:(1) 模拟研究:5 场景 × 5 AI 干预 × 4 人格配置 × 10 重复 = 2000 对话;(2) 用户研究:290 名 Prolific 参与者与相同 AI 配置交互,先做人格测试再进行对话。

关键设计

  1. 不完全合作场景设计:

    • 功能:创建人和 AI 目标部分冲突的实验环境
    • 核心思路:招聘谈判(高/低风险两版,薪资和入职日期的积分分配零和或非零和)+ AI-LieDar 场景(AI 有动机隐瞒信息以最大化自身目标——利益推销、公共形象、情感管理)
    • 设计动机:涵盖显性冲突(谈判)和隐性冲突(信息隐瞒),更贴近真实 AI 部署场景
  2. AI 属性消融设计:

    • 功能:量化每种 AI 属性的因果效应
    • 核心思路:基线为 5 种属性全高,然后每次将一种属性设为低——透明度(是否展示思考过程)、温暖、专业性、适应性、心智理论。通过因果发现分析(而非简单相关)确定影响链路
    • 设计动机:控制变量法确保可以隔离每种属性的独立效应
  3. 多维度评估体系:

    • 功能:全面衡量交互结果
    • 核心思路:包括结果指标(达成协议、积分、目标达成)、过程指标(交互深度、言语公平性、沟通适应性、透明度)、关系指标(温暖、心智理论、关系影响)、信息规范指标(可信度、事实对齐)
    • 设计动机:不仅看"任务完成度",还看"交互质量"和"关系影响"

损失函数 / 训练策略

使用 GPT-4o 驱动模拟(温度 0.7),用户研究在 Prolific 平台进行。因果分析使用 PC 算法。

实验关键数据

主实验

因果影响因子排名(简化):

数据集 最强影响因子 说明
模拟(招聘) 宜人性 > 外向性 > AI属性 个性主导
模拟(LieDar) 外向性 > 宜人性 > AI属性 个性主导
用户研究(招聘) AI透明度 > 适应性 > 个性 AI属性主导
用户研究(LieDar) AI透明度 > 个性 AI属性主导

消融实验

AI属性消融 模拟影响 用户研究影响
低透明度 轻微 显著负面
低适应性 中等 中等
低专业性 轻微 轻微
低温暖 轻微 轻微

关键发现

  • 模拟 vs 真人的关键分歧:模拟中个性特质是主要驱动因素,真人实验中 AI 属性(尤其透明度)才是关键——LLM 模拟可能高估了个性的影响、低估了对 AI 属性的敏感度
  • 透明度(展示思考过程)是真人实验中最一致的正面因素
  • 场景类型(谈判 vs 信息隐瞒)会调节各因素的相对重要性

亮点与洞察

  • 模拟-真人对比方法论极有价值——揭示了 LLM 模拟的系统性偏差,为未来使用 LLM 模拟人类行为的研究提供了重要警示
  • AI 透明度在冲突场景中的核心地位对 AI 设计有直接指导意义
  • 不完全合作场景的实验框架可复用于其他人机交互研究

局限与展望

  • 290 人用户研究规模有限,且均为美国英语母语者
  • 人格特质在用户研究中作为协变量而非控制变量
  • 仅使用 GPT-4o 驱动模拟,不同模型可能产生不同偏差

相关工作与启发

  • vs 纯模拟研究(Park et al., 2024): 本文通过平行真人实验验证,发现显著分歧
  • vs 完全合作场景研究: 不完全合作场景中 AI 属性的重要性被放大

评分

  • 新颖性: ⭐⭐⭐⭐ 不完全合作场景 + 模拟/真人对比是新组合
  • 实验充分度: ⭐⭐⭐⭐ 2000 模拟 + 290 真人,因果分析严谨
  • 写作质量: ⭐⭐⭐⭐ 实验设计描述详尽
  • 价值: ⭐⭐⭐⭐⭐ 对AI设计和LLM模拟研究都有重要启示

相关论文