📖 NLP 理解¶
🤖 AAAI2026 · 共 2 篇
- Language Models and Logic Programs for Trustworthy Tax Reasoning
-
将税法推理重新定义为语义解析任务,让LLM将法规文本和纳税案例翻译为Prolog逻辑程序,由符号求解器执行计算,通过金标准法规+智能检索案例示例+自一致性检查,在SARA数据集上实现86/100的正确率,并将预计部署成本降至15.78美元/人(低于美国人均报税成本的6%)。
- NeSTR: A Neuro-Symbolic Abductive Framework for Temporal Reasoning in Large Language Models
-
提出 NeSTR 神经符号提示策略,通过将自然语言时间事实转化为结构化符号谓词,结合一致性验证和溯因反思修正,在零样本设置下让 LLM 实现高质量时间推理,GPT-4o-mini 上平均 F1 达 89.7(相比 vanilla 64.9 和 TISER 85.8)。