GigaCheck: Detecting LLM-generated Content via Object-Centric Span Localization¶

会议: ACL 2026
arXiv: 2410.23728
代码: GitHub
领域: AI-Generated Text Detection
关键词: LLM生成文本检测, 目标检测范式, DETR, 文本片段定位, 人机协作文本

一句话总结¶

提出 GigaCheck，一个双策略框架：文档级使用微调 LLM 进行分类，片段级创新地将 AI 生成文本片段视为"目标"，用 DETR-like 架构实现端到端的字符级定位。

研究背景与动机¶

领域现状：随着 LLM 生成内容质量的快速提升，AI 生成文本在许多场景下已难以与人写文本区分。检测 AI 生成内容已成为对抗虚假信息、学术欺诈和垃圾内容传播的重要需求。

现有痛点：(1) 文档级检测方法在人机协作文本（部分人写+部分机写）上可靠性不足；(2) 现有的片段级检测方法主要基于 token 级序列标注(BIO)，需要手动后处理来聚合 token 为连续片段，且受限于句子边界和固定粒度；(3) 检测方法的发展速度落后于生成模型的进步。

核心矛盾：需要同时解决文档级分类（"这篇文章是否为 AI 生成？"）和片段级定位（"具体哪些段落是 AI 生成的？"），且两个任务之间应共享表示以提高效率。

本文目标：提出一个统一框架，既能进行高精度的文档级检测，又能精确定位 AI 生成的文本片段。

核心idea：将 AI 生成的文本片段类比为图像中的"目标"，利用视觉目标检测中成熟的 DETR 架构进行端到端的 1D 片段检测，将视觉检测的鲁棒性迁移到文本领域。

方法详解¶

整体框架¶

GigaCheck 采用共享骨干+双头架构：(1) 统一骨干：LoRA 微调的 Mistral-7B 提供文本嵌入；(2) DETR 头：将嵌入序列视为 1D 特征图，使用 DN-DAB-DETR 架构检测 AI 生成片段；(3) 分类头：使用最后 EOS token 的隐状态接 MLP 进行文档级二分类。两个头可独立使用但共享微调骨干。

关键设计¶

目标中心的文本片段检测(Object-Centric Span Localization):
- 功能：将 AI 生成的连续文本片段作为 1D "目标"进行端到端检测和定位
- 核心思路：从微调 LLM 获得 token 嵌入 \(\mathbf{E}\)，经线性投影和 Transformer 编码器得到上下文特征 \(\mathbf{R}\)。\(N\) 个可学习的锚点查询 \((c, w)\)（中心和宽度）通过 Transformer 解码器迭代精炼，每层预测偏移量 \((\Delta c, \Delta w)\)。最终输出 \((c, w, p)\) 三元组——中心位置、宽度和置信度，所有值归一化到 \([0,1]\) 的字符级区间
- 设计动机：序列标注方法需要手动后处理聚合 token 为片段，而 DETR 直接回归连续区间，消除了对启发式后处理的依赖。字符级而非 token 级的定位更灵活，不受分词器影响
统一文本表示骨干(Unified Text-Representation Backbone):
- 功能：为检测和分类两个任务提供共享的高质量文本嵌入
- 核心思路：使用 LoRA 微调 Mistral-7B，训练代理任务：三类分类（人写/机写/协作）用于冻结特征提取（供 DETR），二类分类（人写/机写）与分类头联合训练。LoRA 保持预训练权重冻结，仅训练低秩矩阵
- 设计动机：数据集通常较小，LoRA 在小数据上泛化更好且训练更快。共享骨干验证了嵌入的泛化能力
DN-DAB-DETR 适配:
- 功能：稳定训练并提升定位精度
- 核心思路：采用 DAB-DETR 的可学习锚框作为位置查询，DN-DETR 的去噪训练策略（同时训练可学习查询和加噪 GT 查询）。使用匈牙利匹配进行预测-GT 配对
- 设计动机：DN-DAB-DETR 在视觉检测中展现了最佳的定位精度和训练稳定性，相比 DAB-DETR、Deformable DETR、CO-DETR 表现最好

损失函数 / 训练策略¶

训练损失为 L1 + gIoU + Focal Loss 的加权和，分别对匈牙利匹配的预测和去噪 GT 查询计算。分类头使用二元交叉熵。DETR 训练时骨干冻结，分类头训练时骨干可训练。

实验关键数据¶

主实验（分类）¶

数据集	GigaCheck(Mistral-7B)	之前SOTA	说明
TuringBench(FAIR)	高精度	基于 RoBERTa 的方法	统一骨干即可达到强分类性能
TweepFake	高精度	-	推文领域验证
MAGE	高精度	-	多生成器、多领域的大规模验证

主实验（片段检测）¶

数据集	GigaCheck(DETR)	之前方法	说明
RoFT	强定位精度	序列标注方法	单边界场景
RoFT-ChatGPT	强定位精度	-	ChatGPT 生成场景
TriBERT	强定位精度	-	多边界(1-3)场景

关键发现¶

DETR 架构可以成功从视觉空间推广到文本空间，证明了目标检测范式在 NLP 中的可行性
同一微调骨干在分类和检测两个任务上都表现优异，验证了学到的嵌入具有强泛化能力
端到端的片段检测消除了序列标注方法中的启发式后处理需求
基于 LoRA 的参数高效微调在小数据集上特别有效

亮点与洞察¶

范式创新：将文本片段检测重新定义为 1D 目标检测问题，是一个优雅且有效的跨领域迁移
统一框架：一个微调骨干同时服务于检测和分类，不仅高效，还验证了嵌入的通用性
端到端设计：DETR 直接输出字符级区间，避免了 BIO 标注+后处理的繁琐流程
模型无关性：骨干可替换为任何解码器式 LLM，框架具有良好的扩展性
开源贡献：完整代码公开发布，促进可复现性

局限与展望¶

当前仅在英语文本上评估，多语言适配是重要的未来方向
检测数据集中的生成器主要是较早期的模型（GPT-2/3、CTRL），对最新 LLM 的检测效果未知
DETR 的查询数量 \(N\) 需要根据数据集预设，无法动态适应
与对抗性攻击（如释义、水印移除）的鲁棒性分析不足
未来可探索多粒度检测（段落级 + 句子级 + 词级的联合检测）

评分¶

新颖性: ⭐⭐⭐⭐⭐ 首次将 DETR 应用于文本片段定位，范式创新意义重大
实验充分度: ⭐⭐⭐⭐ 3个分类+3个检测基准的双重验证，但缺乏最新 LLM 的测试
写作质量: ⭐⭐⭐⭐ 架构图清晰，方法描述严谨，跨模态类比恰当
价值: ⭐⭐⭐⭐ 为 AI 生成文本检测提供了新的技术路线，开源增强了影响力