跳转至

✏️ 知识编辑

📷 CVPR2026 · 1 篇论文解读

Attribution-Guided Model Rectification of Unreliable Neural Network Behaviors

提出归因引导的动态模型纠正框架,将rank-one model editing从领域适配重定位为行为纠正,通过Integrated Gradients量化各层可编辑性自动定位嫌疑层,仅需1个清洁样本即可修复后门攻击、虚假相关和特征泄漏三类不可靠行为。