跳转至

Are We in the AI-Generated Text World Already? Quantifying and Monitoring AIGT on Social Media

会议: ACL 2025
arXiv: 2412.18148
代码: https://github.com/TrustAIRLab/AIGT_on_Social_Media
领域: 文本生成
关键词: AI生成文本, 社交媒体监测, 文本检测, 纵向分析, 平台差异

一句话总结

首次大规模量化社交媒体上 AI 生成文本(AIGT)的占比变化——收集 Medium/Quora/Reddit 上 240 万帖子,构建 AIGTBench 训练最佳检测器 OSM-Det,发现 2022-2024 年间 Medium 和 Quora 的 AIGT 占比从~2% 飙升至~37-39%,而 Reddit 仅从 1.3% 增至 2.5%。

研究背景与动机

  1. 领域现状:LLM 能力的快速提升使得 AI 生成文本在社交媒体上日益普遍。AIGT 可能被用于传播虚假信息和操纵舆论。
  2. 现有痛点:(a) 不清楚社交媒体上 AIGT 到底有多少——缺乏系统性的量化研究;(b) 不同平台的 AIGT 渗透率可能差异巨大但无人追踪;(c) 现有检测数据集不够多样化,缺乏针对社交媒体文本的基准。
  3. 核心矛盾:AIGT 的增长速度可能远超检测能力的提升,但没有数据支持这一判断。
  4. 本文要解决什么? 建立 AIGT 在社交媒体上的量化监测体系——构建检测器和数据集,追踪 AIGT 的纵向变化。
  5. 切入角度:大规模数据收集(240万帖子) + 多源检测基准(12个LLM) + 纵向追踪(2022-2024)。
  6. 核心idea一句话:Medium/Quora上约1/3内容已是AI生成,但Reddit增长缓慢——平台文化影响AIGT渗透。

方法详解

整体框架

(1) 收集 SM-D 数据集——240万帖子来自 Medium/Quora/Reddit (2022.1-2024.10);(2) 构建 AIGTBench——结合公开数据集和用12个LLM从社交媒体文本生成的AIGT数据;(3) 训练最佳检测器 OSM-Det;(4) 用 OSM-Det 对 SM-D 做纵向分析。

关键设计

  1. AIGTBench 基准:
  2. 做什么:为社交媒体AIGT检测提供训练和评估基准
  3. 核心思路:收集社交媒体上的人工文本,用12个不同LLM生成对应的AI文本,构成配对数据
  4. 12个LLM覆盖不同规模和架构——GPT-4/Claude/Llama/Mistral等
  5. 设计动机:单一LLM的检测器泛化差,需要多源训练

  6. OSM-Det 检测器:

  7. 做什么:从多个已有检测器中选择/训练最佳的社交媒体AIGT检测器
  8. 核心思路:在AIGTBench上评估多种检测方法(统计/预训练/微调),选择最佳方案
  9. 设计动机:不同检测器在不同场景下表现差异大,需要系统比较

  10. AI Attribution Rate (AAR) 纵向追踪:

  11. 做什么:量化每个平台每月的 AIGT 占比变化
  12. 核心思路:用 OSM-Det 对 SM-D 中每月的帖子做检测,统计 AIGT 比例
  13. 关键发现:Medium (1.77%→37.03%)、Quora (2.06%→38.95%)、Reddit (1.31%→2.45%)

损失函数 / 训练策略

  • OSM-Det 基于 RoBERTa 微调,标准二分类
  • 评估包含多种检测方法的系统比较

实验关键数据

主实验(AAR 纵向变化,2022.1-2024.10)

平台 2022.1 AAR 2024.10 AAR 增长倍数
Medium 1.77% 37.03% 20.9x
Quora 2.06% 38.95% 18.9x
Reddit 1.31% 2.45% 1.9x

分析维度

维度 AIGT vs 人工文本差异
语言模式 AIGT更正式、更长、词汇更多样
话题分布 AIGT集中在技术/科学/商业话题
互动水平 AIGT帖子获得的互动(点赞/评论)更低
作者粉丝分布 AIGT作者倾向于粉丝数较少

关键发现

  • Medium 和 Quora 的 AIGT 增长惊人——约1/3内容已是AI生成。Reddit的增长显著慢——可能因为Reddit社区文化更注重原创和讨论
  • AIGT 作者通常粉丝数较少——暗示AI文本被用于快速扩张内容而非已有影响力者使用
  • AIGT 帖子互动水平更低——用户可能隐式识别了AI内容的特征并减少互动
  • ChatGPT 发布(2022.11)后 AAR 加速增长——直接因果关系

亮点与洞察

  • 首次提供社交媒体 AIGT 的量化证据——"约1/3已是AI"这个数据具有极高的引用和政策价值。
  • 平台差异反映了社区文化对 AIGT 渗透的调节作用——匿名+长文平台(Medium/Quora)更易被渗透,社区驱动平台(Reddit)有天然抗性。
  • AIGTBench 是有价值的检测基准——12个LLM的多样性保证了检测器的泛化能力。
  • AIGT 互动水平更低的发现暗示平台算法可能已隐式降权AI内容。
  • 关于AIGT的话题分布偏好(技术/科学为主)为内容审核提供了方向。

局限性 / 可改进方向

  • OSM-Det 的准确率不可能100%——大规模应用时的假阳/假阴率影响 AAR 估计
  • 仅覆盖三个英语平台——X/Twitter、YouTube等大平台未包含
  • AAR变化可能部分受平台政策变化影响(如Medium的审核政策)
  • 未区分AIGT的不同使用目的(辅助写作vsSPAM)

相关工作与启发

  • vs MultiSocial: MultiSocial构建检测基准,本文更进一步做纵向量化监测
  • vs Perez et al.: 他们研究迭代生成的信息退化,本文关注AIGT在社交媒体的扩散
  • 为平台内容治理和AI文本监管提供了数据基础

评分

  • 新颖性: ⭐⭐⭐⭐⭐ 首次大规模纵向量化社交媒体AIGT,数据极具引用价值
  • 实验充分度: ⭐⭐⭐⭐⭐ 240万帖子+12LLM+3平台+纵向追踪+多维分析
  • 写作质量: ⭐⭐⭐⭐ 数据展示清晰,发现有冲击力
  • 价值: ⭐⭐⭐⭐⭐ 对AI治理和内容监管有重要政策意义