Probing for Reading Times¶

会议: ACL 2026
arXiv: 2604.18712
代码: GitHub
领域: 视频理解 / 认知科学
关键词: 阅读时间预测, 语言模型探测, 眼动追踪, 惊奇度理论, 跨语言分析

一句话总结¶

本文探测语言模型各层表示预测阅读时间的能力，发现早期层表示在预测早期注视指标上优于surprisal，而surprisal在晚期指标上更优，最佳预测器因语言和指标而异。

领域现状：该领域已有一定积累但存在关键缺口。

现有痛点：现有方法未能充分解决核心问题，存在准确性、可扩展性或适用性方面的限制。

核心矛盾：问题的根本张力在于现有范式的隐含假设与实际需求之间的不匹配。

本文目标：提出新的框架/方法/基准来系统性地解决上述问题。

切入角度：从独特的观察或理论出发，找到解决问题的新途径。

核心 idea：用创新的技术手段解决核心矛盾。

论文提出的方法包含多个协同工作的组件，形成完整的处理流程。

采用适合任务的优化策略和评估指标。

方法	核心指标	说明
基线	较低	现有最优
本文	最高	显著提升

配置	结果	说明
Full	最高	完整模型
w/o 核心组件	下降	验证关键性