HACo-Det: A Study Towards Fine-Grained Machine-Generated Text Detection under Human-AI Coauthoring¶

多轮释义生成: 模拟真实人机交互的多轮编辑过程，产生更自然的混合文本。
词级标注规则: 释义后发生变化的词标为 machine，未变化的词保留 human 标签。
检测器改造: 将文档级检测器（metric-based 和 finetune-based）改造为序列标注模型，在词级别做预测后聚合到句级别。

会议: ACL 2025
arXiv: 2506.02959
代码: 无
领域: AIGC检测
关键词: 人机协作文本, 细粒度检测, 词级标注, AI贡献比, 释义攻击

一句话总结¶

本文探索人机协作文本的细粒度检测问题，提出词级标注的 HACo-Det 数据集（通过多轮 LLM 部分释义生成），改造 7 种主流文档级检测器到词/句级别检测，发现基于度量的方法效果差（平均F1仅0.462），微调模型表现更优但仍有大量改进空间。

领域现状：机器生成文本（MGT）检测主要是文档级二分类任务，但人机协作写作系统（如 GPT-4o-canvas、Notion）日益普及。
现有痛点：现有检测方法无法应对人机混合文本——二分类标签对协作文本不公平。部分工作用人类开头提示 LLM 续写却标记全部为 MGT，或用释义标注时未区分未改变的部分。
核心矛盾：人机协作文本中谁写了什么需要细粒度归因，但词级标注的数据和方法都非常缺乏。
本文目标：定义细粒度检测任务，构建词级标注数据集，评估现有方法的适用性。
切入角度：用主流指令LLM对文本进行多轮部分释义，生成具有词级 human/machine 标注的协作文本。
核心 idea：细粒度检测可以给出数值化的 AI 贡献比和定位，缓解协作文本归属的争议。

构建 HACo-Det 数据集：从人类文本中按规则采样段落 → 用 LLM 多轮释义 → 词级别标注（释义部分标为 machine，未改变部分标为 human）。改造 7 种检测器到词/句级别。

评估基准，测试了FastDetect、DetectGPT、RoBERTa等7种检测器。

方法类别	词级F1	说明
Metric-based	0.462 avg	效果差
Finetune-based	更优	但仍有大量改进空间