LLM DNA: Tracing Model Evolution via Functional Representations¶
会议: ICLR 2026
arXiv: 2509.24496
代码: GitHub
领域: 模型压缩
关键词: LLM DNA, 模型进化树, 功能表示, 系统发育分析, 模型溯源
一句话总结¶
从生物学 DNA 类比出发,将 LLM DNA 数学定义为模型功能行为的低维双 Lipschitz 表示,证明其满足遗传和基因决定性属性,并设计了无需训练的 RepTrace 管道在 305 个 LLM 上提取 DNA、构建进化树。
研究背景与动机¶
Hugging Face 上有数百万个 LLM,它们通过微调、蒸馏、适配等方式相互衍生,但进化关系通常缺乏文档记录。追踪模型进化对安全审计(后门传递追踪)、模型治理(许可证合规验证)和多智能体系统设计都至关重要。
现有方法的局限:
任务特定表示(HybridLLM, RouteLLM):为特定下游任务训练,不具通用性
固定模型集表示(EmbedLLM):添加新模型需要重训练,非内在属性
token/参数级比较(Nikolic等):依赖相同的分词器或架构,无法跨异构模型泛化
核心问题是:能否定义一种内在的、通用的 LLM "DNA",使得功能相似的模型具有相近的 DNA,且 DNA 对微调等小扰动保持稳定?
核心idea:定义 LLM DNA 为从功能空间到低维空间的双 Lipschitz 映射,利用 Johnson-Lindenstrauss 引理证明存在性,用随机线性投影实现提取。
方法详解¶
整体框架¶
RepTrace 管道:选取采样输入集 → 每个LLM生成文本响应 → 句子嵌入模型编码为语义向量 → 拼接所有响应向量 → 随机高斯投影到低维DNA空间。
关键设计¶
-
LLM DNA 数学定义:
- 功能:将每个 LLM 映射为一个低维向量(DNA)
- 核心思路:定义 DNA 映射满足双 Lipschitz 条件 \(c_1 \cdot d_H(f_1, f_2) \leq d_\tau(\tau_{f_1}, \tau_{f_2}) \leq c_2 \cdot d_H(f_1, f_2)\)。下界保证基因决定性(相近DNA → 相似功能),上界保证遗传性(小修改 → 相近DNA)
- 设计动机:类比生物DNA的两个核心属性,提供严格的数学保证
-
存在性证明与构造:
- 功能:证明满足定义的 DNA 一定存在,并给出构造方法
- 核心思路:先将 LLM 功能表示为高维 Hilbert 空间中的向量(Lemma A.4),再由 JL 引理保证低维双Lipschitz嵌入存在。DNA维度 \(L = O\left(\left[\frac{c_2+c_1}{c_2-c_1}\right]^2 \log K\right)\),\(K\) 为模型数量
- 设计动机:JL引理的随机投影是最优线性降维方法(Larsen & Nelson, 2014),且计算高效
-
RepTrace 实用管道:
- 语义感知表示:用句子嵌入模型(如 Qwen3-Embedding-8B)将文本响应编码为向量,解决表层文本匹配的不足
- 随机功能距离:采样 \(t\) 个代表性提示,用经验距离近似真实功能距离,满足集中不等式 \(P(|\frac{1}{t}\hat{d}_f^2 - d_H^2| \geq \epsilon) \leq 2\exp(-\frac{2t\epsilon^2}{C_{\max}^2})\)
- 具体实现:6个数据集各100个样本作为输入,生成响应后嵌入拼接,随机高斯矩阵 \(A \sim \mathcal{N}(0, 1/\sqrt{L})\) 投影
损失函数 / 训练策略¶
RepTrace 完全无需训练。唯一需要的是采样输入集和预计算的随机投影矩阵,都是一次性操作。
实验关键数据¶
主实验 (关系检测, 305个LLM)¶
| 方法 | Accuracy | Precision | Recall | F1 | AUC |
|---|---|---|---|---|---|
| Random | 50.0 | 50.0 | 50.0 | 50.0 | 0.500 |
| Greedy | ~65 | - | - | - | - |
| PhyloLM | ~80 | - | - | ~80 | ~0.85 |
| DNA (Qwen-8B) | ~95 | - | - | ~95 | 0.992 |
| DNA (BGE-0.3B) | ~95 | - | - | ~95 | 0.99+ |
| DNA (MPNet-0.1B) | ~95 | - | - | ~95 | 0.99+ |
消融实验¶
| 配置 | AUC | 说明 |
|---|---|---|
| 6个数据集混合 (默认) | 0.992 | 多样性输入 |
| 单一数据集 | 略低 | 覆盖不足 |
| Qwen3-Embedding-8B | 0.992 | 默认嵌入模型 |
| BGE-large-0.3B | 0.99+ | 小模型同样有效 |
| MPNet-0.1B | 0.99+ | 极小模型也可用 |
| 合成随机输入 | 仍有效 | 鲁棒性强 |
关键发现¶
- DNA在305个LLM上实现0.992的关系检测AUC,远超PhyloLM
- t-SNE可视化清晰展示模型家族聚类(Qwen、Llama等)和微调衍生关系
- 发现多个未文档化的模型关系(如vicuna来自Llama-base,orca-2来自Llama-chat)
- DNA对嵌入模型选择、输入数据分布、chat模板变化均具鲁棒性
- 构建的系统发育进化树反映了从encoder-decoder到decoder-only的架构变迁
亮点与洞察¶
- LLM DNA的形式化定义(双Lipschitz + 遗传 + 基因决定性)为模型分析提供了严格的理论基础
- 无需训练、无需访问模型参数的设计使其适用于闭源模型(仅需API调用)
- DNA独立于固定模型集合——新模型的DNA可独立计算而不影响已有模型
- 系统发育树的构建将生物学工具引入AI模型管理领域
局限与展望¶
- DNA维度 \(L\) 与双Lipschitz常数的紧致性权衡——高保真度需要高维DNA
- 采样输入集的选择对特定关系的检测可能有偏
- 当前聚焦文本生成模型,多模态模型尚未覆盖
- "误报"分析表明召回率高于精度,可能存在未记录的真实关系
相关工作与启发¶
- vs EmbedLLM: DNA是内在属性,不依赖固定模型集合
- vs PhyloLM: 基于语义而非token分布,跨分词器泛化更好
- vs 水印方法: DNA是事后提取,不需要修改训练过程
评分¶
- 新颖性: ⭐⭐⭐⭐⭐ 将生物DNA概念严格形式化到LLM领域,理论优美
- 实验充分度: ⭐⭐⭐⭐⭐ 305个模型的大规模验证,丰富的消融和鲁棒性分析
- 写作质量: ⭐⭐⭐⭐⭐ 理论推导严谨,实验展示清晰
- 价值: ⭐⭐⭐⭐⭐ 对模型治理、安全审计和生态分析有深远意义
相关论文¶
- [ACL 2025] Who Taught You That? Tracing Teachers in Model Distillation
- [ICLR 2026] Evolution and compression in LLMs: On the emergence of human-aligned categorization
- [ICML 2025] Generalization Bounds via Meta-Learned Model Representations: PAC-Bayes and Sample Compression Hypernetworks
- [AAAI 2026] CoEvo: Continual Evolution of Symbolic Solutions Using Large Language Models
- [ICLR 2026] A State-Transition Framework for Efficient LLM Reasoning