SMART: Self-Aware Agent for Tool Overuse Mitigation¶

vs ReAct/Toolformer: 它们教模型"如何用工具"，SMART 教模型"何时不用工具"
vs 元认知研究: 将心理学中的元认知概念应用到 LLM Agent 设计

会议: ACL 2025
arXiv: 2502.11435
代码: https://github.com/qiancheng0/Open-SMARTAgent (有)
领域: LLM Agent
关键词: 工具过度使用, 元认知, 自感知Agent, 参数化知识, 工具调用优化

一句话总结¶

揭示 LLM Agent 中的"工具过度使用"现象（≥30% 的工具调用是不必要的），提出 SMART 元认知范式，通过在推理步骤中显式标注"知识驱动 vs 工具依赖"来训练 Agent 的自感知能力，7B 模型匹配 GPT-4o 水平。

领域现状：LLM Agent 系统通常配备外部工具（计算器、搜索引擎、API等），但使用策略多依赖启发式或手工规则。
现有痛点：LLM 经常在自身参数化知识已能解决问题时仍调用工具——作者定义为"工具过度使用"（Tool Overuse），过度使用率 \(\alpha \cdot \beta\)（\(\alpha\) 为无需工具的问题比例，\(\beta\) 为其中不必要调用工具的比例），在现有系统中超过 30%。
核心矛盾：Agent 缺乏元认知能力——无法评估自己的参数化知识是否足以解决当前问题，默认倾向于"有工具就用"。
本文要解决什么：如何让 Agent "知道自己知道什么"，从而在知识充足时不调工具、确实需要时才调？
切入角度：构建 SMART-ER 数据集，在每个推理步骤标注"这步用知识还是工具"及理由，通过 SFT 训练 Agent 的自感知。
核心 idea：显式的元认知训练——让模型学会在推理中判断每一步是否需要工具。

构建 SMART-ER 数据集（Math/Time/Intention 三领域）→ 标注每步推理为知识驱动或工具依赖（含理由）→ SFT 训练 SMARTAgent → 推理时自主决定何时调工具。

模型	工具调用次数	准确率	领域
Llama-3.1-8B baseline	1.93	51%	Math
SMARTAgent 8B	0.88	54.75%	Math
宏平均改进	-24% 调用	+37.1% 准确率	Overall