Clients Collaborate: Flexible Differentially Private Federated Learning with Guaranteed Improvement of Utility-Privacy Trade-off¶

会议: ICML 2025
arXiv: 2402.07002
代码: https://github.com/6lyc/FedCEO_Collaborate-with-Each-Other
领域: AI安全
关键词: 联邦学习, 差分隐私, 效用-隐私权衡, 张量低秩, 语义互补

一句话总结¶

提出 FedCEO 框架，通过在服务器端对堆叠的客户端模型参数进行张量低秩近端优化，利用不同客户端间的语义互补性恢复 DP 噪声破坏的语义信息，将效用-隐私权衡界改进了 \(O(\sqrt{d})\) 量级。

领域现状：差分隐私（DP）是联邦学习中保护用户隐私的主流技术标准，通过向上传的模型更新添加随机噪声实现。

现有痛点：DP 噪声随机破坏模型的语义完整性，且这种破坏随通信轮数积累——不同客户端被破坏的语义信息各不相同，导致全局语义空间不平滑。

核心矛盾：现有改进方法（如正则化、个性化）都基于约束本地更新大小，未利用客户端间的协作关系。

本文目标：如何利用客户端间的语义互补性来恢复被 DP 噪声破坏的语义信息？

切入角度：将多个客户端的噪声模型参数堆叠成高阶张量，通过截断高频分量实现全局语义空间的平滑化。

核心 idea：DP 噪声的随机性意味着不同客户端被破坏的语义部分不同——张量低秩分解能提取客户端间的共享语义并去除个体噪声。

FedCEO 在标准 DPFL 基础上，在服务器端增加一步张量低秩近端优化： 1. 各客户端本地训练后添加 DP 噪声，上传噪声模型 2. 服务器将 K 个客户端的模型参数堆叠为三阶张量 3. 执行截断张量奇异值分解（T-tSVD）平滑全局语义空间 4. 将平滑后的参数广播回客户端

张量低秩近端优化:
- 功能：将 K 个客户端的参数矩阵堆叠为三阶张量 \(\mathcal{W} \in \mathbb{R}^{m \times d \times K}\)，执行低秩近端优化
- 核心思路：等价于在频谱空间截断高频分量（T-tSVD），保留客户端间共享的低频语义信息，去除各客户端独立的高频噪声
- 设计动机：DP 噪声在频谱空间主要表现为高频分量，截断可有效去噪
自适应秩控制:
- 功能：根据噪声水平（隐私预算 ε）和训练阶段动态调整截断秩
- 核心思路：噪声越大（ε 越小）截断越激进，训练后期语义趋于收敛时可放松截断
- 设计动机：固定秩无法适应不同隐私设置和训练阶段的需求

在 CIFAR-10 上用 MLP 架构、不同隐私预算下的测试准确率：