🗣️ 对话系统¶

🧪 ICML2025 · 3 篇论文解读

Agent WARPP: Workflow Adherence via Runtime Parallel Personalization: 提出 WARPP，一个无需训练的多智能体框架，在运行时根据用户属性动态剪枝条件分支工作流，并通过并行化的 Personalizer 智能体与模块化域特定智能体协同执行，在提升工具调用精度和参数保真度的同时减少 token 消耗。
Investigating Non-Transitivity in LLM-as-a-Judge: 揭示了 LLM-as-a-Judge 框架中评判偏好的非传递性问题（A>B, B>C 不能推出 A>C），证明固定基线模型的排名方式不可靠，提出基于循环赛 + Bradley-Terry 模型的排名方法及高效的 Swim 锦标赛策略。
Position: Uncertainty Quantification Needs Reassessment for Large-language Model Agents: 本文是一篇 Position Paper，通过梳理文献中 aleatoric 和 epistemic 不确定性的多种相互矛盾的定义，论证传统二分法在 LLM 交互场景中根本性失效，并提出 underspecification uncertainty（任务/上下文欠规范）、interactive learning（通过追问减少不确定性）和 output uncertainty（用自然语言而非标量表达不确定性）三个新研究方向。