跳转至

🗣️ 对话系统

🧪 ICML2025 · 3 篇论文解读

Agent WARPP: Workflow Adherence via Runtime Parallel Personalization

提出 WARPP,一个无需训练的多智能体框架,在运行时根据用户属性动态剪枝条件分支工作流,并通过并行化的 Personalizer 智能体与模块化域特定智能体协同执行,在提升工具调用精度和参数保真度的同时减少 token 消耗。

Investigating Non-Transitivity in LLM-as-a-Judge

揭示了 LLM-as-a-Judge 框架中评判偏好的非传递性问题(A>B, B>C 不能推出 A>C),证明固定基线模型的排名方式不可靠,提出基于循环赛 + Bradley-Terry 模型的排名方法及高效的 Swim 锦标赛策略。

Position: Uncertainty Quantification Needs Reassessment for Large-language Model Agents

本文是一篇 Position Paper,通过梳理文献中 aleatoric 和 epistemic 不确定性的多种相互矛盾的定义,论证传统二分法在 LLM 交互场景中根本性失效,并提出 underspecification uncertainty(任务/上下文欠规范)、interactive learning(通过追问减少不确定性)和 output uncertainty(用自然语言而非标量表达不确定性)三个新研究方向。