AIMSCheck: Leveraging LLMs for AI-Assisted Review of Modern Slavery Statements Across Jurisdictions¶

会议: ACL 2025
arXiv: 2506.01671
代码: 公开
领域: NLP 理解
关键词: 现代奴隶制, 合规审查, 跨司法管辖, LLM, 文本分类

一句话总结¶

提出 AIMSCheck——使用 LLM 辅助审查企业现代奴隶制声明是否合规的端到端框架，构建英国和加拿大的新标注数据集（AIMS.uk/AIMS.ca），三层分解合规评估增强可解释性，在澳大利亚数据上训练的模型能有效跨司法管辖泛化到英国和加拿大。

领域现状：多国出台了现代奴隶制法案要求企业披露其打击奴隶制的努力。但验证这些声明是否真正合规仍然是挑战——声明语言复杂多样且数量庞大。
现有痛点：(a) 人工审查成本高且不可扩展；(b) 标注数据稀缺（现有标注仅覆盖澳大利亚）；(c) 不同国家的法律框架不同——一个国家训练的模型能否用于其他国家未知。
核心矛盾：合规审查需要法律+语言双重专业知识，NLP 工具需要处理高度专业化的法律文本。
本文要解决什么？ 构建跨司法管辖的合规审查框架和基准数据集。
切入角度：与领域专家合作标注新数据，设计三层分解的合规评估（文档级→段落级→条款级），增强可解释性。
核心idea一句话：三层合规分解 + 跨司法管辖泛化 = 可扩展的现代奴隶制审查。

三层分解：(1) 文档级——判断声明是否整体合规；(2) 段落级——识别哪些段落包含合规相关内容；(3) 条款级——判断具体法律条款在声明中是否被满足。

训练数据	测试数据	L1 准确率	L2 F1	说明
澳大利亚	澳大利亚	高	高	域内
澳大利亚	英国	良好	良好	跨域泛化
澳大利亚	加拿大	良好	良好	跨域泛化