De-Anonymization at Scale via Tournament-Style Attribution¶

会议: ACL 2026
arXiv: 2601.12407
代码: 无
领域: AI 安全 / 隐私
关键词: 作者归因, 去匿名化, LLM隐私威胁, 锦标赛式匹配, 同行评审

一句话总结¶

本文提出 DAS（De-Anonymization at Scale），一种基于 LLM 的大规模作者去匿名化方法，采用锦标赛式淘汰策略+密集检索预过滤+多轮投票聚合，可在数万候选文本中进行作者匹配，揭示了 LLM 对匿名平台（如双盲评审）的隐私威胁。

研究背景与动机¶

领域现状：传统作者归因（AA）在封闭集小规模场景下研究——给定少量候选作者和标注样本，训练分类器进行归因。但现实匿名系统（如学术同行评审）可能有数万候选者且无标注数据。

现有痛点：(1) 传统方法在大规模场景下不可行——需要为每个候选者构建作者画像；(2) 近期用 GPT-3/4 进行作者归因的工作仍局限于小规模候选集；(3) LLM 的文本分析能力可能使大规模去匿名化成为现实威胁。

核心矛盾：匿名系统（如双盲评审、举报人论坛）依赖身份隐藏来保护公正和安全，但 LLM 可能通过分析写作模式、领域专长等信号识别匿名作者。

本文目标：开发一种可在数万候选文本池中实用运行的 LLM 作者匹配方法，并评估其对匿名系统的威胁程度。

切入角度：将大规模作者匹配建模为锦标赛式淘汰赛——将候选者随机分组，LLM 在每组中选出最可能的匹配，胜出者进入下一轮，最终产生排名。

核心 idea：渐进淘汰 + 密集检索预过滤 + 多轮投票聚合 = 在受限 token 预算下实现大规模去匿名化。

方法详解¶

整体框架¶

DAS 包含三个组件：(1) 密集检索预过滤——用嵌入检索将 \(10^5\) 级候选池缩小到 \(10^3\) 级；(2) 锦标赛式淘汰——将候选分为固定大小的组，LLM 在每组中选出最可能的匹配，胜出者重新分组并反复比较直到产生 top-k 排名；(3) 多轮投票聚合——多次独立运行（不同随机分组），对每个候选的胜出次数加分，聚合产生最终排名。

关键设计¶

锦标赛式渐进淘汰:
- 功能：将一对多匹配分解为多轮小规模比较
- 核心思路：将候选随机分为固定大小的组（如 5 个一组），LLM 比较查询文本与组内所有候选，选出最可能的匹配。胜出者进入下一轮重新分组，重复直到收敛到 top-k
- 设计动机：LLM 的上下文窗口有限，无法同时比较数万候选；分组比较将复杂度降低到对数级
密集检索预过滤:
- 功能：将搜索空间缩小到 LLM 可处理的规模
- 核心思路：用嵌入模型将查询和所有候选编码，通过向量相似度检索 top-\(N\)（如 1000）作为后续锦标赛的输入
- 设计动机：将 \(10^5\) 级的搜索空间缩减到 \(10^3\) 级，使得后续 LLM 比较在 token 预算内可行
多轮投票聚合:
- 功能：提高排名稳定性和精度
- 核心思路：多次独立运行锦标赛（不同随机分组），每次为胜出候选分配分数，聚合所有轮次的分数产生最终排名。一致在不同分组中胜出的候选获得更高排名
- 设计动机：单次随机分组可能因组内竞争不公平而产生偏差，多轮聚合增加鲁棒性

损失函数 / 训练策略¶

DAS 是无训练的推理时方法，仅使用 LLM 的文本分析能力。核心计算来自 LLM 的成对比较提示。

实验关键数据¶

主实验¶

匿名评审数据上的去匿名化表现

场景	候选池大小	DAS 准确率	随机基线
同行评审	数千	远高于随机	~0.01%
Enron 邮件	标准基准	优于先前方法	-
博客文章	大规模	优于先前方法	-

消融实验¶

组件	去除后效果	说明
密集检索预过滤	无法运行	候选池太大
多轮投票	准确率下降	单轮不稳定
锦标赛淘汰	准确率下降	需要渐进比较

关键发现¶

DAS 在数千候选的匿名评审数据中成功识别同作者文本，准确率远高于随机
在标准基准（Enron、博客）上超越先前直接 LLM 提示的方法
多轮投票显著提升排名精度和稳定性
密集检索预过滤不仅是效率手段，还通过缩小候选池提高了后续匹配质量

亮点与洞察¶

揭示了一个严肃的隐私威胁——LLM 使大规模去匿名化变得实际可行
锦标赛式设计优雅地解决了大规模一对多匹配的计算瓶颈
方法论具有通用性——可应用于任何需要从大候选池中找到匹配的文本归因场景

局限与展望¶

准确率虽高于随机但仍有限，特定场景下可能不足以构成实际威胁
密集检索的召回质量可能限制最终准确率
作为潜在隐私攻击工具，需要配套的防御措施和伦理讨论
对风格相似的作者（如同一实验室成员）可能区分能力有限

评分¶

新颖性: ⭐⭐⭐⭐ 锦标赛式大规模归因设计新颖，隐私威胁视角重要
实验充分度: ⭐⭐⭐⭐ 真实评审数据+标准基准，但匿名评审实验的规模可以更大
写作质量: ⭐⭐⭐⭐ 动机清晰，方法描述系统
价值: ⭐⭐⭐⭐ 对匿名系统的安全性评估有实际意义