On Multi-Step Theorem Prediction via Non-Parametric Structural Priors¶

日期: 2026-03-05
arXiv: 2603.04852
代码: 无（暂未公开）
领域: LLM推理
关键词: theorem prediction, structural prior, ICL, formal geometry, priority graph

一句话总结¶

Pri-TPG 通过定理优先级图编码解决方案结构的时间依赖关系，结合 ICL 扩展在多步定理预测中达到 89.29% 准确率，匹配训练型方法（88.36%）且较 Vanilla ICL（26.29%）提升 63%。

领域现状：多步定理预测（给定几何条件，预测下一步应用什么定理）是自动化推理的核心挑战，训练型方法（如 FGeo-HyperGNet）需要大量标注数据。
现有痛点：(1) Vanilla ICL 在多步推理中严重退化（结构漂移）——随着推理步数增加，模型逐渐偏离正确的推理路径；(2) 搜索空间大（~200 个定理），随机探索效率极低。
核心矛盾：多步推理需要对定理间的依赖关系有结构化理解，但 ICL 仅通过示例隐式学习，缺乏显式的结构约束。
切入角度：从解决方案痕迹中提取定理优先级图——显式编码"定理 A 常在定理 B 之后使用"的结构信息，压缩搜索空间。

Pri-TPG 三步：(1) 从训练集解决方案中构建定理优先级图（DAG）；(2) 给定当前状态，用优先级图约束候选定理集合（~200 → ~30）；(3) 在约束集合上用 ICL + 多模态检索选择定理。

定理优先级图（Priority Graph）：
- 从解决方案痕迹中提取：如果定理 B 在定理 A 之后出现，建立边 A→B
- 非参数方法——直接从数据统计，无需训练
- 搜索空间压缩：\(O(|\mathcal{L}|) \to O(|\mathcal{L}_{qt}|)\)，约 90% 压缩（~200 → ~30）
结构漂移识别：
- 发现 Vanilla ICL 在长链推理中的系统性退化
- 前几步正确率高但随步数增涨快速下降
- 优先级图约束有效防止偏移到无关定理
多模态检索：
- 利用问题的几何图形和条件文本做双模态检索
- 从训练集中找到结构相似的问题作为 ICL 示例

方法	FormalGeo7K 准确率	Geometry3K 准确率	类型
Vanilla ICL	26.29%	-	无训练
FGeo-HyperGNet	88.36%	92.5%	训练型
Pri-TPG (GPT-5.2)	89.29%	95.16%	无训练

难度	L1	L2	L3	L4	L5	L6
Pri-TPG	99.16%	95.2%	88.1%	72.3%	55.0%	30%
Vanilla ICL	45%	30%	18%	10%	5%	2%