Are We in the AI-Generated Text World Already? Quantifying and Monitoring AIGT on Social Media¶
会议: ACL 2025
arXiv: 2412.18148
代码: https://github.com/TrustAIRLab/AIGT_on_Social_Media
领域: 文本生成
关键词: AI生成文本, 社交媒体监测, 文本检测, 纵向分析, 平台差异
一句话总结¶
首次大规模量化社交媒体上 AI 生成文本(AIGT)的占比变化——收集 Medium/Quora/Reddit 上 240 万帖子,构建 AIGTBench 训练最佳检测器 OSM-Det,发现 2022-2024 年间 Medium 和 Quora 的 AIGT 占比从~2% 飙升至~37-39%,而 Reddit 仅从 1.3% 增至 2.5%。
研究背景与动机¶
- 领域现状:LLM 能力的快速提升使得 AI 生成文本在社交媒体上日益普遍。AIGT 可能被用于传播虚假信息和操纵舆论。
- 现有痛点:(a) 不清楚社交媒体上 AIGT 到底有多少——缺乏系统性的量化研究;(b) 不同平台的 AIGT 渗透率可能差异巨大但无人追踪;(c) 现有检测数据集不够多样化,缺乏针对社交媒体文本的基准。
- 核心矛盾:AIGT 的增长速度可能远超检测能力的提升,但没有数据支持这一判断。
- 本文要解决什么? 建立 AIGT 在社交媒体上的量化监测体系——构建检测器和数据集,追踪 AIGT 的纵向变化。
- 切入角度:大规模数据收集(240万帖子) + 多源检测基准(12个LLM) + 纵向追踪(2022-2024)。
- 核心idea一句话:Medium/Quora上约1/3内容已是AI生成,但Reddit增长缓慢——平台文化影响AIGT渗透。
方法详解¶
整体框架¶
(1) 收集 SM-D 数据集——240万帖子来自 Medium/Quora/Reddit (2022.1-2024.10);(2) 构建 AIGTBench——结合公开数据集和用12个LLM从社交媒体文本生成的AIGT数据;(3) 训练最佳检测器 OSM-Det;(4) 用 OSM-Det 对 SM-D 做纵向分析。
关键设计¶
- AIGTBench 基准:
- 做什么:为社交媒体AIGT检测提供训练和评估基准
- 核心思路:收集社交媒体上的人工文本,用12个不同LLM生成对应的AI文本,构成配对数据
- 12个LLM覆盖不同规模和架构——GPT-4/Claude/Llama/Mistral等
-
设计动机:单一LLM的检测器泛化差,需要多源训练
-
OSM-Det 检测器:
- 做什么:从多个已有检测器中选择/训练最佳的社交媒体AIGT检测器
- 核心思路:在AIGTBench上评估多种检测方法(统计/预训练/微调),选择最佳方案
-
设计动机:不同检测器在不同场景下表现差异大,需要系统比较
-
AI Attribution Rate (AAR) 纵向追踪:
- 做什么:量化每个平台每月的 AIGT 占比变化
- 核心思路:用 OSM-Det 对 SM-D 中每月的帖子做检测,统计 AIGT 比例
- 关键发现:Medium (1.77%→37.03%)、Quora (2.06%→38.95%)、Reddit (1.31%→2.45%)
损失函数 / 训练策略¶
- OSM-Det 基于 RoBERTa 微调,标准二分类
- 评估包含多种检测方法的系统比较
实验关键数据¶
主实验(AAR 纵向变化,2022.1-2024.10)¶
| 平台 | 2022.1 AAR | 2024.10 AAR | 增长倍数 |
|---|---|---|---|
| Medium | 1.77% | 37.03% | 20.9x |
| Quora | 2.06% | 38.95% | 18.9x |
| 1.31% | 2.45% | 1.9x |
分析维度¶
| 维度 | AIGT vs 人工文本差异 |
|---|---|
| 语言模式 | AIGT更正式、更长、词汇更多样 |
| 话题分布 | AIGT集中在技术/科学/商业话题 |
| 互动水平 | AIGT帖子获得的互动(点赞/评论)更低 |
| 作者粉丝分布 | AIGT作者倾向于粉丝数较少 |
关键发现¶
- Medium 和 Quora 的 AIGT 增长惊人——约1/3内容已是AI生成。Reddit的增长显著慢——可能因为Reddit社区文化更注重原创和讨论
- AIGT 作者通常粉丝数较少——暗示AI文本被用于快速扩张内容而非已有影响力者使用
- AIGT 帖子互动水平更低——用户可能隐式识别了AI内容的特征并减少互动
- ChatGPT 发布(2022.11)后 AAR 加速增长——直接因果关系
亮点与洞察¶
- 首次提供社交媒体 AIGT 的量化证据——"约1/3已是AI"这个数据具有极高的引用和政策价值。
- 平台差异反映了社区文化对 AIGT 渗透的调节作用——匿名+长文平台(Medium/Quora)更易被渗透,社区驱动平台(Reddit)有天然抗性。
- AIGTBench 是有价值的检测基准——12个LLM的多样性保证了检测器的泛化能力。
- AIGT 互动水平更低的发现暗示平台算法可能已隐式降权AI内容。
- 关于AIGT的话题分布偏好(技术/科学为主)为内容审核提供了方向。
局限性 / 可改进方向¶
- OSM-Det 的准确率不可能100%——大规模应用时的假阳/假阴率影响 AAR 估计
- 仅覆盖三个英语平台——X/Twitter、YouTube等大平台未包含
- AAR变化可能部分受平台政策变化影响(如Medium的审核政策)
- 未区分AIGT的不同使用目的(辅助写作vsSPAM)
相关工作与启发¶
- vs MultiSocial: MultiSocial构建检测基准,本文更进一步做纵向量化监测
- vs Perez et al.: 他们研究迭代生成的信息退化,本文关注AIGT在社交媒体的扩散
- 为平台内容治理和AI文本监管提供了数据基础
评分¶
- 新颖性: ⭐⭐⭐⭐⭐ 首次大规模纵向量化社交媒体AIGT,数据极具引用价值
- 实验充分度: ⭐⭐⭐⭐⭐ 240万帖子+12LLM+3平台+纵向追踪+多维分析
- 写作质量: ⭐⭐⭐⭐ 数据展示清晰,发现有冲击力
- 价值: ⭐⭐⭐⭐⭐ 对AI治理和内容监管有重要政策意义