Agent-Based Simulation of Trust Development in Human-Robot Teams¶
日期: 2026-03-01
arXiv: 2603.01189
代码: 开源(NetLogo)
领域: 具身智能 / 人机协作
关键词: human-robot trust, agent-based model, trust dynamics, NetLogo, meta-analysis validation
一句话总结¶
提出一个基于 NetLogo 的 agent-based model 模拟人机团队中的信任动态,经 Hancock 元分析验证(Spearman ρ=0.833),发现机器人可靠性主导任务成功率(η²=0.93),并揭示了"信任-性能脱耦"现象——高信任不等于高性能,校准误差才是关键诊断指标。
研究背景与动机¶
- 领域现状:人机协作中信任是核心——过度信任导致依赖失误,信任不足导致弃用。但信任动态难以用真人实验系统研究(成本高、变量多)。
- 现有痛点:(a) 现有信任模型大多是静态的,不能捕捉信任随时间的演化;(b) 信任增长和衰退的不对称性(失败比成功影响更大)的定量模型缺乏;(c) 元分析给出统计规律但缺乏动态机制解释
- 核心矛盾:信任高不一定意味着系统表现好——可能是"过度信任"了不可靠的系统
- 切入角度:用 agent-based simulation 将元分析的统计规律转化为动态机制模型,并探索信任和性能之间的非直觉关系
- 核心 idea:模拟+验证+发现——构建可靠的信任动态仿真,在 Hancock 元分析上验证后,用情景分析揭示"信任-性能脱耦"的反直觉现象
方法详解¶
整体框架¶
在 NetLogo 6.4.0 中模拟 2-10 个 agent 的人机团队,每个 agent 有信任值、能力值和工作负载属性。任务按复杂度分级,agent 间通过协作完成任务,信任根据交互结果动态更新。
关键设计¶
-
信任动态更新模型
- 做什么:模拟信任随交互的增减
- 核心思路:成功交互增加信任(增量 \(\Delta^+\)),失败交互减少信任(增量 \(\Delta^-\)),且 \(|\Delta^-| > |\Delta^+|\)(不对称性)。包含信任修复机制
- 设计动机:复现心理学中信任不对称性的经典发现
-
多维信任前因建模
- 做什么:将 Hancock 元分析中的 8 类信任前因(可靠性、透明度、沟通、协作等)纳入模型
- 核心思路:每类前因有独立参数,通过加权影响信任更新幅度
- 验证结果:4/8 类达到区间效度,整体序数效度 ρ=0.833
-
情景分析框架
- 做什么:系统探索极端配置下的信任-性能关系
- 关键发现 — 信任恢复场景(Trust Recovery):最高生产力 4.29 但最低信任 38.2;不可靠机器人场景(Unreliable Robot):最高信任 73.2 但最低成功率 33.4%
统计验证¶
- OFAT 和全因子设计,每条件 n=50 次重复
- ANOVA 确认可靠性、透明度、沟通、协作显著(p<.001),解释 45.4% 信任方差
实验关键数据¶
主实验 — 灵敏度分析¶
| 因素 | 对信任 η² | 对成功率 η² | 对生产力 η² |
|---|---|---|---|
| 机器人可靠性 | 0.35 | 0.93 | 0.89 |
| 透明度 | 0.12 | 0.15 | 0.13 |
| 沟通 | 0.08 | 0.10 | 0.09 |
| 协作 | 0.06 | 0.07 | 0.06 |
信任-性能脱耦¶
| 场景 | 信任均值 | 成功率 | 生产力 |
|---|---|---|---|
| Trust Recovery | 38.2(最低) | 中 | 4.29(最高) |
| Unreliable Robot | 73.2(最高) | 33.4%(最低) | 低 |
关键发现¶
- 机器人可靠性是压倒性主因——解释 93% 的成功率方差和 89% 的生产力方差
- 信任不对称比率(0.07-0.55)远低于元分析基准(1.50),说明持续信任修复可以缩小累积不对称
- 信任-性能脱耦是最重要发现:说明仅监控信任值不够,需要同时跟踪"校准误差"(信任与实际可靠性的偏差)
亮点与洞察¶
- "高信任≠好结果"的反直觉发现:提出校准误差作为关键诊断指标,对人机协作系统设计有直接指导意义
- 元分析验证的严谨性:不是自说自话,与 Hancock 2021 大规模元分析对齐验证
- 开源仿真工具:NetLogo 实现可供后续研究复用和扩展
局限性 / 可改进方向¶
- 信任模型仍是简化的——未考虑个体差异、文化因素
- 仅在仿真中验证,真实人机实验验证缺失
- 信任修复机制假设较简单
相关工作与启发¶
- vs Hancock 2021 元分析: 将静态统计规律动态化,补充了机制解释
- vs Lee & See 信任模型: 经典理论模型,本文提供了可计算的仿真实现
评分¶
- 新颖性: ⭐⭐⭐ 信任仿真不新,但信任-性能脱耦的发现有价值
- 实验充分度: ⭐⭐⭐⭐ 元分析验证+灵敏度分析+情景分析全面
- 写作质量: ⭐⭐⭐⭐ 定量分析严谨
- 价值: ⭐⭐⭐ 偏人因工程方向,对 AI/ML 研究者启发有限但对 HRI 社区有价值