Agent-Based Simulation of Trust Development in Human-Robot Teams¶

日期: 2026-03-01
arXiv: 2603.01189
代码: 开源（NetLogo）
领域: 具身智能 / 人机协作
关键词: human-robot trust, agent-based model, trust dynamics, NetLogo, meta-analysis validation

一句话总结¶

提出一个基于 NetLogo 的 agent-based model 模拟人机团队中的信任动态，经 Hancock 元分析验证（Spearman ρ=0.833），发现机器人可靠性主导任务成功率（η²=0.93），并揭示了"信任-性能脱耦"现象——高信任不等于高性能，校准误差才是关键诊断指标。

研究背景与动机¶

领域现状：人机协作中信任是核心——过度信任导致依赖失误，信任不足导致弃用。但信任动态难以用真人实验系统研究（成本高、变量多）。
现有痛点：(a) 现有信任模型大多是静态的，不能捕捉信任随时间的演化；(b) 信任增长和衰退的不对称性（失败比成功影响更大）的定量模型缺乏；(c) 元分析给出统计规律但缺乏动态机制解释
核心矛盾：信任高不一定意味着系统表现好——可能是"过度信任"了不可靠的系统
切入角度：用 agent-based simulation 将元分析的统计规律转化为动态机制模型，并探索信任和性能之间的非直觉关系
核心 idea：模拟+验证+发现——构建可靠的信任动态仿真，在 Hancock 元分析上验证后，用情景分析揭示"信任-性能脱耦"的反直觉现象

方法详解¶

整体框架¶

在 NetLogo 6.4.0 中模拟 2-10 个 agent 的人机团队，每个 agent 有信任值、能力值和工作负载属性。任务按复杂度分级，agent 间通过协作完成任务，信任根据交互结果动态更新。

关键设计¶

信任动态更新模型
- 做什么：模拟信任随交互的增减
- 核心思路：成功交互增加信任（增量 \(\Delta^+\)），失败交互减少信任（增量 \(\Delta^-\)），且 \(|\Delta^-| > |\Delta^+|\)（不对称性）。包含信任修复机制
- 设计动机：复现心理学中信任不对称性的经典发现
多维信任前因建模
- 做什么：将 Hancock 元分析中的 8 类信任前因（可靠性、透明度、沟通、协作等）纳入模型
- 核心思路：每类前因有独立参数，通过加权影响信任更新幅度
- 验证结果：4/8 类达到区间效度，整体序数效度 ρ=0.833
情景分析框架
- 做什么：系统探索极端配置下的信任-性能关系
- 关键发现 — 信任恢复场景（Trust Recovery）：最高生产力 4.29 但最低信任 38.2；不可靠机器人场景（Unreliable Robot）：最高信任 73.2 但最低成功率 33.4%

统计验证¶

OFAT 和全因子设计，每条件 n=50 次重复
ANOVA 确认可靠性、透明度、沟通、协作显著（p<.001），解释 45.4% 信任方差

实验关键数据¶

主实验 — 灵敏度分析¶

因素	对信任 η²	对成功率 η²	对生产力 η²
机器人可靠性	0.35	0.93	0.89
透明度	0.12	0.15	0.13
沟通	0.08	0.10	0.09
协作	0.06	0.07	0.06

信任-性能脱耦¶

场景	信任均值	成功率	生产力
Trust Recovery	38.2（最低）	中	4.29（最高）
Unreliable Robot	73.2（最高）	33.4%（最低）	低

关键发现¶

机器人可靠性是压倒性主因——解释 93% 的成功率方差和 89% 的生产力方差
信任不对称比率（0.07-0.55）远低于元分析基准（1.50），说明持续信任修复可以缩小累积不对称
信任-性能脱耦是最重要发现：说明仅监控信任值不够，需要同时跟踪"校准误差"（信任与实际可靠性的偏差）

亮点与洞察¶

"高信任≠好结果"的反直觉发现：提出校准误差作为关键诊断指标，对人机协作系统设计有直接指导意义
元分析验证的严谨性：不是自说自话，与 Hancock 2021 大规模元分析对齐验证
开源仿真工具：NetLogo 实现可供后续研究复用和扩展

局限性 / 可改进方向¶

信任模型仍是简化的——未考虑个体差异、文化因素
仅在仿真中验证，真实人机实验验证缺失
信任修复机制假设较简单

评分¶

新颖性: ⭐⭐⭐ 信任仿真不新，但信任-性能脱耦的发现有价值
实验充分度: ⭐⭐⭐⭐ 元分析验证+灵敏度分析+情景分析全面
写作质量: ⭐⭐⭐⭐ 定量分析严谨
价值: ⭐⭐⭐ 偏人因工程方向，对 AI/ML 研究者启发有限但对 HRI 社区有价值