Are We in the AI-Generated Text World Already? Quantifying and Monitoring AIGT on Social Media¶

会议: ACL 2025
arXiv: 2412.18148
代码: https://github.com/TrustAIRLab/AIGT_on_Social_Media
领域: 文本生成
关键词: AI生成文本, 社交媒体监测, 文本检测, 纵向分析, 平台差异

一句话总结¶

首次大规模量化社交媒体上 AI 生成文本(AIGT)的占比变化——收集 Medium/Quora/Reddit 上 240 万帖子，构建 AIGTBench 训练最佳检测器 OSM-Det，发现 2022-2024 年间 Medium 和 Quora 的 AIGT 占比从~2% 飙升至~37-39%，而 Reddit 仅从 1.3% 增至 2.5%。

研究背景与动机¶

领域现状：LLM 能力的快速提升使得 AI 生成文本在社交媒体上日益普遍。AIGT 可能被用于传播虚假信息和操纵舆论。
现有痛点：(a) 不清楚社交媒体上 AIGT 到底有多少——缺乏系统性的量化研究；(b) 不同平台的 AIGT 渗透率可能差异巨大但无人追踪；(c) 现有检测数据集不够多样化，缺乏针对社交媒体文本的基准。
核心矛盾：AIGT 的增长速度可能远超检测能力的提升，但没有数据支持这一判断。
本文要解决什么？ 建立 AIGT 在社交媒体上的量化监测体系——构建检测器和数据集，追踪 AIGT 的纵向变化。
切入角度：大规模数据收集(240万帖子) + 多源检测基准(12个LLM) + 纵向追踪(2022-2024)。
核心idea一句话：Medium/Quora上约1/3内容已是AI生成，但Reddit增长缓慢——平台文化影响AIGT渗透。

方法详解¶

整体框架¶

(1) 收集 SM-D 数据集——240万帖子来自 Medium/Quora/Reddit (2022.1-2024.10)；(2) 构建 AIGTBench——结合公开数据集和用12个LLM从社交媒体文本生成的AIGT数据；(3) 训练最佳检测器 OSM-Det；(4) 用 OSM-Det 对 SM-D 做纵向分析。

关键设计¶

AIGTBench 基准:
做什么：为社交媒体AIGT检测提供训练和评估基准
核心思路：收集社交媒体上的人工文本，用12个不同LLM生成对应的AI文本，构成配对数据
12个LLM覆盖不同规模和架构——GPT-4/Claude/Llama/Mistral等
设计动机：单一LLM的检测器泛化差，需要多源训练
OSM-Det 检测器:
做什么：从多个已有检测器中选择/训练最佳的社交媒体AIGT检测器
核心思路：在AIGTBench上评估多种检测方法（统计/预训练/微调），选择最佳方案
设计动机：不同检测器在不同场景下表现差异大，需要系统比较
AI Attribution Rate (AAR) 纵向追踪:
做什么：量化每个平台每月的 AIGT 占比变化
核心思路：用 OSM-Det 对 SM-D 中每月的帖子做检测，统计 AIGT 比例
关键发现：Medium (1.77%→37.03%)、Quora (2.06%→38.95%)、Reddit (1.31%→2.45%)

损失函数 / 训练策略¶

OSM-Det 基于 RoBERTa 微调，标准二分类
评估包含多种检测方法的系统比较

实验关键数据¶

主实验（AAR 纵向变化，2022.1-2024.10）¶

平台	2022.1 AAR	2024.10 AAR	增长倍数
Medium	1.77%	37.03%	20.9x
Quora	2.06%	38.95%	18.9x
Reddit	1.31%	2.45%	1.9x

分析维度¶

维度	AIGT vs 人工文本差异
语言模式	AIGT更正式、更长、词汇更多样
话题分布	AIGT集中在技术/科学/商业话题
互动水平	AIGT帖子获得的互动(点赞/评论)更低
作者粉丝分布	AIGT作者倾向于粉丝数较少

关键发现¶

Medium 和 Quora 的 AIGT 增长惊人——约1/3内容已是AI生成。Reddit的增长显著慢——可能因为Reddit社区文化更注重原创和讨论
AIGT 作者通常粉丝数较少——暗示AI文本被用于快速扩张内容而非已有影响力者使用
AIGT 帖子互动水平更低——用户可能隐式识别了AI内容的特征并减少互动
ChatGPT 发布(2022.11)后 AAR 加速增长——直接因果关系

亮点与洞察¶

首次提供社交媒体 AIGT 的量化证据——"约1/3已是AI"这个数据具有极高的引用和政策价值。
平台差异反映了社区文化对 AIGT 渗透的调节作用——匿名+长文平台(Medium/Quora)更易被渗透，社区驱动平台(Reddit)有天然抗性。
AIGTBench 是有价值的检测基准——12个LLM的多样性保证了检测器的泛化能力。
AIGT 互动水平更低的发现暗示平台算法可能已隐式降权AI内容。
关于AIGT的话题分布偏好（技术/科学为主）为内容审核提供了方向。

局限性 / 可改进方向¶

OSM-Det 的准确率不可能100%——大规模应用时的假阳/假阴率影响 AAR 估计
仅覆盖三个英语平台——X/Twitter、YouTube等大平台未包含
AAR变化可能部分受平台政策变化影响（如Medium的审核政策）
未区分AIGT的不同使用目的（辅助写作vsSPAM）

评分¶

新颖性: ⭐⭐⭐⭐⭐ 首次大规模纵向量化社交媒体AIGT，数据极具引用价值
实验充分度: ⭐⭐⭐⭐⭐ 240万帖子+12LLM+3平台+纵向追踪+多维分析
写作质量: ⭐⭐⭐⭐ 数据展示清晰，发现有冲击力
价值: ⭐⭐⭐⭐⭐ 对AI治理和内容监管有重要政策意义