KAN-AD: Time Series Anomaly Detection with Kolmogorov-Arnold Networks¶

会议: ICML 2025
arXiv: 2411.00278
代码: 无
领域: Time Series
关键词: 时间序列异常检测, KAN, Kolmogorov-Arnold网络, B样条, 傅里叶展开

一句话总结¶

KAN-AD 将时间序列异常检测重新建模为用光滑单变量函数逼近序列，用截断傅里叶展开替代 KAN 中的 B 样条避免局部扰动敏感性，以不到 1000 个参数在 4 个基准上平均提升 15% 检测精度。

领域现状: 时间序列异常检测 (TSAD) 是云服务和 Web 系统实时监控的核心能力。主流方法基于预测模型（预测下一步，大偏差→异常）。

现有痛点: (a) 预测模型倾向于过拟合小波动，对局部扰动过于敏感；(b) 有效的 TSAD 应关注"正常"行为的全局平滑模式，而非细节抖动；(c) 直接使用 KAN (Kolmogorov-Arnold Network) 虽然理论上能用单变量函数逼近，但 B 样条的局部性使其对扰动敏感。

核心矛盾: 精确拟合 vs 鲁棒检测——过于精确的拟合反而降低了异常检测能力。

本文切入: 从 Kolmogorov-Arnold 表示定理出发，将时间序列建模为光滑单变量函数的组合。

核心 idea: 用截断傅里叶展开替代 B 样条作为 KAN 的基函数，傅里叶的全局性天然免疫局部扰动，加上轻量学习机制强调全局模式。

输入：时间序列窗口 → KAN-AD (傅里叶基函数 + 轻量学习机制) → 预测下一步值 → 计算预测误差 → 超阈值即为异常。

傅里叶 KAN 替代 B 样条 KAN:
- Kolmogorov-Arnold 表示定理：\(f(\mathbf{x}) = \sum_{q=0}^{2n} \Phi_q(\sum_{p=1}^n \phi_{q,p}(x_p))\)
- 标准 KAN 用 B 样条参数化 \(\phi_{q,p}\)，但 B 样条是局部基函数——对输入小扰动敏感
- KAN-AD 用截断傅里叶级数：\(\phi(x) = a_0 + \sum_{k=1}^K (a_k \cos(kx) + b_k \sin(kx))\)
- 每个单变量函数的光滑性由傅里叶截断阶 \(K\) 控制
- 设计动机：傅里叶基函数是全局的，单个系数的改变影响整条曲线，天然抗局部噪声
轻量学习机制:
- 强调全局模式的低频信息
- 限制网络容量，避免拟合高频噪声
- 极少参数（<1000 个可训练参数）
- 设计动机：小模型天然具有正则化效果，学到的只能是最显著的模式
异常检测策略:
- 正常数据训练：拟合"正常"行为的光滑模式
- 测试时：异常点偏离光滑模式 → 大预测误差 → 检测为异常
- 设计动机：模型无法拟合异常模式，从而产生大误差信号

基准	指标	KAN-AD	之前SOTA	提升
基准1	F1 / AUC	最优	-	显著
基准2	F1 / AUC	最优	-	显著
基准3	F1 / AUC	最优	-	峰值超27%
基准4	F1 / AUC	最优	-	显著
4基准平均	检测精度	-	-	+15%