KTCF: Actionable Recourse in Knowledge Tracing via Counterfactual Explanations for Education¶
会议: AAAI2026
arXiv: 2601.09156
代码: 待确认
领域: causal_inference
关键词: Knowledge Tracing, Counterfactual Explanation, XAI, Actionable Recourse, Education
一句话总结¶
提出 KTCF,一种面向知识追踪(KT)的反事实解释生成方法,通过考虑知识概念间关系生成稀疏且可操作的反事实解释,并将其后处理为顺序化的教学指令,在有效性、稀疏性和可操作性指标上全面超越基线方法。
背景与动机¶
- 深度学习驱动的知识追踪(Knowledge Tracing, KT)在教育领域广泛应用,用于建模学生的知识掌握程度并预测未来表现
- 欧盟 AI 法案将教育类 AI 归为高风险系统,要求模型具备可解释性;美国教育部也强调 AI 应保护人类决策权
- 现有 KT 可解释性研究主要关注"模型关注了什么"(attention heatmap)或"模型是否准确捕捉了学习过程"(心理测量参数),属于 what 类问题
- 缺乏回答"why"和"how"类问题的方法——即"为什么模型给出这个预测""学生应该怎么做才能改变预测结果"
- 反事实解释天然具有因果性和局部性,且对非专业的教育利益相关者(学生、教师、家长)易于理解,但在 KT 领域尚未被充分探索
核心问题¶
给定学生的学习历史序列 \(X^{\text{orig}} = [(kc_1, r_1), \ldots, (kc_t, r_t)]\) 和训练好的 KT 模型 \(f\),当模型对目标知识概念 \(kc_{\text{target}}\) 预测为"答错"时,如何找到一组最小改动的反事实响应 \(R^{\text{cf}}\),使得模型预测翻转为"答对",同时保证:
- 干预稀疏性:改动尽可能少
- 可操作性:只允许将"答错"改为"答对"(不能反向操作)
- 知识概念关系一致性:建议修改的知识概念与目标概念在知识图谱上相关
- 顺序化输出:解释以有序的教学指令呈现,最小化学生的总学习负担
方法详解¶
反事实解释生成(Algorithm 1)¶
KTCF 将反事实生成建模为一个优化问题,损失函数为三项之和:
\[\mathcal{L}_{\text{KTCF}} = \mathcal{L}_{\text{pred}} + \lambda_{\text{spar}} \cdot \mathcal{L}_{\text{spar}} + \lambda_{\text{kc}} \cdot \mathcal{L}_{\text{kc}}\]
- 预测损失 \(\mathcal{L}_{\text{pred}}\):反事实输入经 KT 模型的预测值与目标概率 1.0 之间的二元交叉熵,驱动预测翻转
- 稀疏损失 \(\mathcal{L}_{\text{spar}}\):原始响应与反事实响应之间的 Hamming 距离,鼓励最少改动
- KC 损失 \(\mathcal{L}_{\text{kc}}\):利用预定义的知识概念关系无向图 \(G_{\text{kc}}\),对与目标 KC 图距离较远的改动进行惩罚,确保建议修改的 KC 与目标 KC 在知识结构上相关
使用 Adam 优化器进行随机优化,每步更新后通过可操作性掩码 \(\mathbf{m}\) 投影,确保只有原本答错的位置才能被修改,从而实现 100% 可操作性。
初始化策略¶
论文对比了 5 种初始化方法:高斯噪声(-rn)、随机二值(-rand)、soft relaxation(-sr)、凸组合(-cc)、Gumbel-Sigmoid relaxation(-gs)。实验表明软松弛类初始化(-rn, -sr, -gs)效果最优。
后处理:教学指令序列化(Algorithm 2)¶
将反事实解释转换为学生可执行的顺序学习路径:
- 提取反事实中所有被修改的 KC 集合 \(\overline{V}^{\text{CF}}\)
- 在 KC 关系图上用 Dijkstra 算法计算所有 KC 对之间的最短路径距离
- 构造以这些 KC 为节点的完全子图,边权为最短路径距离
- 用贪心策略从目标 KC 出发求解旅行商路径问题(TSPP),再反转路径
- 输出的序列即为建议学生依次复习的 KC 顺序,最小化总学习负担(总路径距离)
实验关键数据¶
数据集与设置¶
- 数据集:XES3G5M,包含 18,066 名学生的 5,549,635 条交互序列(数学领域)
- KC 关系图:1,175 个节点,1,304 条边
- KT 模型:DKT(LSTM),测试 AUC 0.8226,准确率 0.8253
- 评估:从错误率 >45% 的学生中随机抽取 200 个实例
主要结果(Table 1)¶
| 方法 | Validity↑ | Sparsity↓ | Actionability↓ |
|---|---|---|---|
| Wachter-rand | 0.725 | 67.36 | 40.53 |
| DiCE-rand | 0.880 | 75.59 | 35.32 |
| KTCF-rn | 0.930 | 49.85 | 0.000 |
| KTCF-gs | 0.920 | 49.92 | 0.000 |
- KTCF-rn 相比 Wachter 有效性提升 28.3%,稀疏性降低 26.0%;相比 DiCE 有效性提升 5.7%,稀疏性降低 34.0%
- 所有 KTCF 变体的 Actionability 均为 0(完全消除不可操作修改),而基线方法存在大量不可操作建议
- KTCF-gs 计算速度最快(2.2s),比 Wachter 快 41.9%
定性分析(Table 2)¶
以"区分闰年与非闰年"为目标 KC 的实例:
- KTCF 仅建议 5 个 KC(取模运算、日历周期等),总路径距离 26
- Wachter 建议 14 个 KC(含无关的树状图、小数单位等),总路径距离 66
- DiCE 建议 20 个 KC,总路径距离 79
亮点¶
- 首次系统化地将反事实 XAI 引入知识追踪领域,并提供了完整的概念化框架(explanandum/explanans)
- 可操作性保证:通过掩码机制实现 100% 可操作性,确保只建议"把错的练对",永远不会建议"故意答错"
- 教育理论根基:与 Bloom 的掌握学习理论和 2-Sigma 问题对接,赋予方法教育学理论意义
- KC 关系约束:利用知识概念图谱嵌入损失函数,使建议的修改在知识结构上连贯
- 后处理方案巧妙地将 TSPP 用于生成最优学习路径,减少学生学习负担
局限性 / 可改进方向¶
- 仅在 DKT(LSTM)上验证,未测试 Transformer 架构的 KT 模型(如 AKT、SAINT 等),泛化性有待验证
- KC 关系图依赖预定义结构,对无此类信息的数据集不适用
- 二值响应的反事实生成对初始化策略敏感,虽然 KC 损失提升了鲁棒性,但根本问题未解决
- 后处理采用贪心 TSPP 非最优解,路径质量有提升空间
- 缺乏真实用户研究验证实际教学效果(仅有定性案例分析)
- 评估仅基于 200 个实例,规模较小
与相关工作的对比¶
- vs. Wachter/DiCE:这两种是通用反事实方法,不考虑知识概念关系和教育领域的可操作性约束,导致建议冗余且含不可操作修改。KTCF 通过 KC 损失和可操作性掩码全面解决这些问题
- vs. 注意力热力图解释(AKT、EKT 等):仅回答"模型关注了哪里",不能提供可操作的教学建议
- vs. 心理测量参数解释(IRT-based):预测难度/区分度参数用于诊断,但同样不提供"怎么改进"的行动指南
- vs. SHAP/LRP 后验解释(Lu et al. 2024):解释特征贡献方向但不产生反事实指导;Lu 的用户研究表明解释能提升信任,KTCF 在此基础上更进一步提供可操作步骤
启发与关联¶
- 反事实解释的后处理思路(TSP 路径优化)可推广到其他需要排序建议的场景,如推荐系统中的学习路径规划
- KC 关系图约束的思想可迁移到医疗诊断等领域——用疾病关系图约束反事实建议的合理性
- 可操作性掩码是一个通用技巧,适用于任何具有单向可操作约束的反事实生成问题
- 未来结合 LLM 将反事实解释转化为自然语言教学指令是一个有前景的方向
评分¶
- 新颖性: ⭐⭐⭐⭐ (首次将反事实 XAI 系统化应用于 KT,概念框架完整)
- 实验充分度: ⭐⭐⭐ (消融实验充分,但评估规模较小且缺少用户研究)
- 写作质量: ⭐⭐⭐⭐ (教育理论与技术方法结合自然,定性分析直观)
- 价值: ⭐⭐⭐⭐ (对教育 AI 可解释性有实际推动作用)