ChainEdit: Propagating Ripple Effects in LLM Knowledge Editing through Logical Rule-Guided Chains¶

会议: ACL 2025
arXiv: 2507.08427
代码: https://github.com/NUSTM/ChainEdit
领域: 知识编辑
关键词: 知识编辑, 逻辑规则, 涟漪效应, 知识图谱, 链式更新

一句话总结¶

提出 ChainEdit 框架，通过将知识图谱中挖掘的逻辑规则与 LLM 内在逻辑推理能力对齐，实现知识编辑时的链式更新，将逻辑泛化准确率从约 20% 提升至 58-65%。

领域现状: 知识编辑（Knowledge Editing）技术允许对 LLM 进行定向修改而无需重新训练，主要分为参数保持型和参数修改型两大范式。
现有痛点: 现有知识编辑方法在"涟漪效应"（ripple effect）上表现糟糕——编辑一个事实后，逻辑相关的关联知识无法同步更新。例如修改"美国总统是特朗普"后，模型仍回答"美国第一夫人是吉尔·拜登"。
核心矛盾: RippleEdits benchmark 上的逻辑泛化（Logical Generalization）准确率仅约 20%，说明模型未能将编辑知识与已有推理链有机整合。
本文要解决什么: 使 LLM 在知识编辑时能利用逻辑规则自动推导并同步更新关联知识。
切入角度: 借鉴知识图谱更新机制——KG 通过逻辑规则推断关联知识，将这一思路移植到 LLM 知识编辑中。
核心idea一句话: 从 KG 中挖掘逻辑规则并与 LLM 内在逻辑对齐，实现编辑知识的链式传播。

ChainEdit 分为三个阶段：(1) 规则挖掘与对齐；(2) 规则预处理为指令规则；(3) 规则应用生成关联知识并批量编辑。

规则挖掘（Rule Mining from KG）: 在 Wikidata 上采样 10,000 个实例，识别目标关系 R 的高频替代路径（2-hop 和 3-hop），保留频率超过阈值 γ 的路径作为候选规则。例如：Nationality ← (BornIn, CityOf)。经去重后获得 3,120 条候选规则。
LLM-规则对齐（LLM-Rule Alignment）: 将候选规则转换为自然语言描述，通过 prompt 让 LLM 评估规则的普适性，保留与模型内在逻辑一致的高普适性规则。这确保了规则库既尊重 KG 约束，又符合 LLM 的推理结构。
指令规则与链式更新: 将规则形式化为 ⟨ϕ, ψ⟩，其中 ϕ 为触发条件，ψ 为知识生成模板。显式处理同一规则下的多条合法更新路径（如修改 A 的兄弟为 B 时，可以更新 A 的父亲或 B 的父亲）。

无额外训练过程。ChainEdit 作为即插即用模块与现有编辑方法（MEMIT、LoRA、FT 等）结合，在编辑原始知识的同时批量编辑规则推导出的关联知识。

在 RippleEdits "Popular" 数据集上（Llama-3-8B-Instruct）：

方法	使用ChainEdit	Reliability	LG	RE	SA	RS	FF
MEMIT	✓	90.0	58.7	37.4	65.8	41.9	37.0
MEMIT	✗	99.8	18.6	34.3	75.7	38.0	31.2
FT	✓	100.0	65.5	47.2	97.4	60.2	36.5
FT	✗	98.9	19.2	33.4	73.3	39.8	35.1
LoRA	✓	99.9	65.7	51.0	97.8	48.2	33.0
LoRA	✗	100.0	23.7	41.7	99.0	45.6	28.1

LG（逻辑泛化）指标：MEMIT 从 18.6% → 58.7%（+40.1%），FT 从 19.2% → 65.5%（+46.3%）。

不同规则集的影响（Qwen2.5-1.5B + MEMIT-Merge）：

规则集	Reliability	LG	RE	SA	RS	FF
纯规则挖掘	97.1	53.0	29.8	63.5	36.3	30.5
+ LLM对齐	97.3	60.0	26.0	58.8	36.0	29.3
+ LLM对齐 + 人工筛选	96.6	61.5	29.5	59.0	35.8	29.4

在 Filtered 数据集上 LG 进一步提升至 71.0%（原始数据集为 61.5%），说明去除中间知识不一致的评估噪声后，ChainEdit 的真实效果更好
大小模型的 baseline LG 均不到 20%，说明逻辑泛化是编辑方法的通病而非模型规模问题
LoRA 方法配合 ChainEdit 在 SA（Subject Aliasing）上达到 97.8-99.1%，几乎完美
批量编辑实验（Appendix D）进一步验证了方法的可扩展性