Aligning Language Models with Real-time Knowledge Editing¶

会议: ACL 2026
arXiv: 2508.01302
代码: GitHub
领域: Knowledge Editing
关键词: 实时知识编辑, 知识对齐, 数据集污染, 多样化增强, 自适应推理

一句话总结¶

引入CRAFT（持续更新的中文金融知识编辑数据集）和KEDAS（基于多样化编辑增强和自适应推理的知识编辑对齐范式），解决现有知识编辑方法在实时场景中成功率-局部性-可迁移性难以兼顾的问题。

领域现状：知识编辑旨在高效修改LM中的过时知识，无需完全重训练。但主流评估数据集（ZsRE, MQuAKE, RippleEdits）是静态的，一旦发布就无法更新。

现有痛点：(1) 静态数据集存在严重的数据泄露问题——大部分知识已被LM在预训练中见过，导致评测不公平；(2) WikiBigEdit虽然实时但需要处理数百GB的Wiki数据且稀疏性严重；(3) 现有方法在编辑成功率、局部性和可迁移性之间难以取得平衡。

核心矛盾：参数修改方法（如ROME, WISE）在连续编辑时模型退化严重；检索方法（如IKE, EREN）因缺乏对齐而性能不稳定；对齐方法（如LTE）因过拟合而局部性差。

本文目标：构建一个持续更新、无污染的实时知识编辑数据集，并提出能在所有指标上均衡表现的知识编辑方法。

切入角度：利用中国官方公开的金融统计数据（持续更新且LM未见过）构建数据集，并将知识编辑重新定义为LM对齐问题。

核心 idea：通过一次性离线对齐（LoRA微调）赋予LM知识编辑能力，然后在推理时通过自适应路由决定使用原始模型还是对齐模型，从根本上解决局部性问题。

KEDAS分为两阶段：(1) 离线对齐——用LoRA在知识编辑格式数据上微调LM，赋予其利用编辑提示更新回答的能力；(2) 在线编辑——将新知识以多样化形式存入记忆，推理时智能检索并自适应选择模型路径。

CRAFT数据集:
- 功能：提供持续更新、无污染的实时知识编辑评估基准
- 核心思路：利用中国官方公开的金融和统计数据（如GDP、人口等），设计成对编辑（paired edits）作为组合推理测试。支持别名可迁移性、时间局部性和常识局部性评估
- 设计动机：官方统计数据持续更新，可保证数据新鲜度；成对编辑设计测试了模型整合多个编辑的能力（composit portability）
多样化编辑增强（Diverse Edit Augmentation）:
- 功能：增强编辑记忆的覆盖度和检索鲁棒性
- 核心思路：将每个编辑以多种表达形式存储——包括原始QA对、改写版本、别名版本等，增加检索命中率
- 设计动机：用户查询可能以多种方式表达同一知识需求，单一形式的编辑可能导致检索失败
自适应推理路径（Self-adaptive Inference）:
- 功能：在推理时动态选择是否激活LoRA对齐模型
- 核心思路：过滤增强的智能检索器判断查询是否与任何编辑相关。相关则通过LoRA对齐模型处理（提供编辑上下文）；不相关则直接使用原始LM
- 设计动机：从根本上解决局部性问题——对不相关查询完全不修改模型行为，避免过拟合导致的知识遗忘

对齐阶段使用LoRA微调，训练数据包含编辑范围内和范围外的查询。一次性对齐完成后，后续编辑仅操作记忆，无需修改参数。

方法	编辑成功率	局部性	可迁移性	综合
ROME (参数修改)	高→退化	差	差	不平衡
IKE (检索)	中	中	中	不稳定
LTE (对齐)	高	差(过拟合)	中	不平衡
KEDAS (本文)	高	高	高	全面优秀