跳转至

Quantifying Lexical Semantic Shift via Unbalanced Optimal Transport

会议: ACL 2025 (Findings) arXiv: 2412.12569 代码: GitHub 领域: 计算语言学/语义变迁 关键词: semantic change detection, optimal transport, contextualized embeddings, sense usage shift, diachronic

一句话总结

将 Unbalanced OT 应用于上下文化词嵌入来量化词义变迁,提出 Sense Usage Shift (SUS) 指标在每个用法实例级别量化语义变化(义项使用频率增减),统一解决实例级变化检测、词级变化幅度量化、词义扩展/缩小判定。

研究背景与动机

  1. 领域现状:词汇语义变迁检测用通时语料嵌入估计词变化程度,但只给词级分数。
  2. 现有痛点:无法解释哪些具体用法变化了;距离度量不区分义项增减;词义扩展/缩小无法统一处理。
  3. 核心矛盾:如何在保持词级检测能力的同时提供实例级细粒度解释?
  4. 切入角度:UOT 允许质量创建/销毁——对应新义项出现/旧义项消亡。
  5. 核心 idea:SUS(x) = 该实例在 UOT 传输计划中的盈余或赤字——正值=义项增加,负值=减少。

方法详解

整体框架

输入:目标词在两个时期的上下文化嵌入集。输出:每个实例的 SUS 值 + 词级变化分数。

关键设计

  1. Unbalanced Optimal Transport
  2. 标准 OT 要求总质量相等;UOT 放松约束允许质量创建/销毁
  3. 盈余 = 新义项出现,赤字 = 旧义项消亡
  4. 用 KL 散度惩罚不平衡

  5. Sense Usage Shift (SUS)

  6. SUS > 0:义项使用增加(如 record 的"音乐"义)
  7. SUS < 0:义项使用减少(如 record 的"信息记录"义)

  8. 统一多任务

  9. 实例级:直接读 SUS 值
  10. 词级:聚合 SUS 绝对值
  11. 扩展/缩小:SUS 分布偏度

实验关键数据

词级检测 (SemEval-2020 Task 1)

方法 英语 ρ 德语 拉丁语 瑞典语
APD 0.56 0.72 0.40 0.54
UOT 0.65 0.78 0.47 0.60

关键发现

  • SUS 提供可解释的实例级语义变化:Figure 1 中 record 的音乐义(红)+信息义(蓝)一目了然
  • UOT 在词级也优于传统方法
  • 词义扩展/缩小可由 SUS 分布判定

亮点与洞察

  • OT → 语义变迁的优雅映射:传输计划的盈余/赤字天然对应义项兴衰
  • 统一框架:一个 UOT 求解同时给三层面答案
  • Figure 1 可视化极直观:t-SNE + SUS 颜色编码

局限性 / 可改进方向

  • 计算成本:UOT 对大规模嵌入集较慢
  • 仅比较两个时间点:不支持连续轨迹
  • 依赖嵌入质量

相关工作与启发

  • vs APD:简单距离 vs 最优匹配
  • vs GASC:需预设义项数 vs UOT 自动发现

评分

  • 新颖性: ⭐⭐⭐⭐⭐ UOT 用于语义变迁全新
  • 实验充分度: ⭐⭐⭐⭐ 4语言benchmark+可视化
  • 写作质量: ⭐⭐⭐⭐⭐ Figure 1/Table 1 极直观
  • 价值: ⭐⭐⭐⭐ 为词汇语义变迁提供更强统一工具