How to Enable Effective Cooperation Between Humans and NLP Models: A Survey of Principles, Formalizations, and Beyond¶

会议: ACL 2025 (Long Paper, acl-long.22)
arXiv: 2501.05714
代码: 无
领域: 人机协作 / NLP综述 / LLM交互
关键词: human-model cooperation, 合作形式化, 分类体系, 人在回路, 大语言模型

一句话总结¶

首次系统性地综述了人与NLP模型之间的合作范式，提出基于"谁为最终决策负责"的三类合作形式化分类体系（顺序合作、分诊合作、联合合作），并借鉴Grice合作原则定义了人机合作的基本原则，为后续研究提供了统一视角。

背景与动机¶

随着LLM的发展，智能模型已从单纯的工具演变为具有自主目标和策略的agent，能够与人类协作完成数据标注、信息检索、创意写作等多种NLP任务。尽管已有多篇综述探讨人机交互的要素（如用户界面、反馈类型、评估方法），但关于如何形式化一个有效的人机合作以产生集体输出，现有信息是分散且不充分的。缺乏对合作底层原则和形式化方法的系统性分析，这正是本文要填补的空白。

核心问题¶

如何系统地理解和分类人与NLP模型之间不同形式的合作？现有方法虽然在各种NLP任务上取得了进展，但缺少一个统一的视角来理解：合作是如何发生的？谁为最终决策负责？双方各自扮演什么角色？这些基本问题的答案对于设计更好的人机合作系统至关重要。

方法详解¶

整体框架¶

本文首先定义了人机合作的概念和四条合作原则（源自Grice会话合作原则），然后提出一个基于合作方式和最终决策责任归属的三分类体系，最后讨论了开放挑战和未来方向。

核心分类体系包含两种角色框架： - 辅助者-执行者框架（Assistor-Executor）：一方是辅助者提供信息/建议，另一方是执行者做最终决策，体现层级关系 - 平等伙伴框架（Equal-Partnership）：双方平等参与决策，共同承担责任

关键设计¶

合作原则（Cooperative Principles）：借鉴Grice的会话合作原则，重新诠释为通用合作场景的四条准则：
真诚性（Sincerity）：行为应基于真实信息，不欺骗
相关性（Relation）：贡献应与任务目标相关
方式（Manner）：贡献的复杂度应与任务需求匹配
适量性（Quantity）：提供必要但不过量的信息
顺序合作（Sequential Cooperation）：最普遍的形式，双方按步骤依次工作，遵循辅助者-执行者框架。分为两个子类：
人辅助模型方法（Human-assisted）：模型做最终决策，人提供反馈改进模型。实现方式包括基于训练的方法（如RLHF）和免训练方法（如in-context learning、模型编辑）
模型辅助人方法（Model-assisted）：人做最终决策，模型提供候选方案辅助。关键在于提供准确的方案（如主动学习、类比推理）和可信的方案（如可视化解释、置信度表达）
分诊合作（Triage-based Cooperation）：基于HABA-MABA思想，根据双方能力将任务/数据分配给最适合的一方，遵循平等伙伴框架。任务分配通过两种分配器实现：
基于模型的分配器（Model-based）：将"分诊给人"作为模型输出的额外类别，隐式评估模型能力
额外分配器（Extra allocator）：独立的过滤器，基于预测不确定性、错误率估计、数据难度等指标显式评估模型能力，低于阈值则交给人
联合合作（Joint Cooperation）：双方同时参与同一任务的决策，最终结果来自双方输出的结合，遵循平等伙伴框架。核心挑战是如何融合概率性的模型输出与离散的人类信号——主要通过混淆矩阵（confusion matrix）估计人类决策置信度，再用概率方法结合双方输出。可通过监督学习或EM算法实现。

实验关键数据¶

本文为综述论文，不含直接实验。关键数据体现在文献分析上： - 系统性收集了1007篇论文，经筛选后分析147篇核心论文 - 覆盖NLP、HCI、ML三大领域，特别关注LLM时代的最新进展 - 三类合作形式的典型应用场景：数据标注和信息检索（附录G详细展示）

消融实验要点¶

顺序合作是目前NLP中最普遍的形式，但缺乏跨形式的标准化benchmark来客观比较不同合作形式的优劣
联合合作目前主要限于分类任务，尚难以扩展到生成任务

亮点 / 我学到了什么¶

统一分类视角：用"谁负责最终决策"这个简洁维度将纷繁复杂的人机合作方法归纳为三类，提供了清晰的思维框架
原则化设计：将Grice的语言哲学合作原则迁移到人机合作场景，为合作系统设计提供了规范性基础（而不仅仅是技术导向）
形式化定义：附录C提供了严谨的数学形式化，将人机合作建模为共享效用函数的联合优化问题
LLM的合作违规行为：指出LLM可能出现欺骗（违反真诚性）、与任务无关的回复（违反相关性）、信息过载（违反适量性）等问题，为可信LLM研究提供了新视角
合作形式的历史演进：顺序合作和分诊合作自1970s就有研究，联合合作是近年才兴起的，反映了技术发展对合作形式的推动

局限性 / 可改进方向¶

仅限单人-单模型场景：真实世界往往涉及多人多模型的复杂交互，作者明确将此留作未来工作
未涉及人机协作（collaboration）：协作比合作更高层次，需要双向沟通和共同决策；目前即使是顺序合作中的对话系统也未能实现真正的协作式决策
缺乏实验性验证：提出的分类体系和原则是概念性的，缺少标准化benchmark来实证比较不同合作形式的效果
人类不确定性估计困难：人的决策缺乏显式的不确定性度量，现有方法（集成学习、要求人自报不确定区间）不够可靠
模型协调问题：LLM倾向于采用one-size-fits-all策略，难以适应不同用户的风格，重训练不现实

与相关工作的对比¶

综述	核心区别
Wang et al. (2021a)	侧重NLP任务类型、人类反馈类型和用户界面等要素，未分析合作的形式化方法
Wang et al. (2023e)	聚焦交互对象、界面和消息融合策略，缺乏对合作原则的讨论
Wan et al. (2022)	尝试形式化人机交互类型，但仅限于顺序合作这一种形式
Gao et al. (2024)	提出四种交互模式（Prompting/UI/Context/Agent），侧重交互模式而非合作形式化
本文	首次同时涵盖合作原则和三种合作形式化分类，提供统一视角

启发与关联¶

分诊合作的思想（根据模型能力动态分配任务给人或模型）对AI辅助标注、人机协同评估等场景有直接启发
联合合作通过混淆矩阵融合人机输出的方法，可能对需要高可靠性的领域（法律、医疗）有应用价值
合作原则的框架可用于评估和诊断现有人机交互系统的不足（例如检测LLM是否符合真诚性原则）
当前缺乏跨合作形式的benchmark，这本身就是一个值得探索的研究方向

评分¶

新颖性: ⭐⭐⭐⭐ 首次从原则和形式化角度系统综述人机合作，分类体系简洁有力，但综述本身无新方法
实验充分度: ⭐⭐⭐ 作为综述文献覆盖全面（147篇核心论文），但缺少实证性比较实验
写作质量: ⭐⭐⭐⭐⭐ 结构清晰，从定义到原则到分类到挑战层层递进，附录内容充实（形式化定义、应用示例、历史回顾）
对我的价值: ⭐⭐⭐ 提供了理解人机合作的整体框架，但与视觉/多模态方向的直接关联有限