跳转至

🗣️ 对话系统

🧠 NeurIPS2025 · 5 篇论文解读

AC-LoRA: (Almost) Training-Free Access Control-Aware Multi-Modal LLMs

设计 AC-LoRA 端到端系统,为不同权限数据集训练独立的 LoRA 适配器,推理时根据用户查询的 cosine 相似度和权限动态检索并无训练合并多个 LoRA 输出,在保证强信息隔离的同时匹配或超越 SOTA LoRA 混合方法的回答质量。

Bridging Human and LLM Judgments: Understanding and Narrowing the Gap

提出Bridge统计框架,通过序数logistic回归建模人类和LLM评判之间的潜在关系,以少量人类标签改善LLM评判的校准和对齐,同时支持对系统性偏差的正式统计检验。

HyGen: Efficient LLM Serving via Elastic Online-Offline Request Co-location

提出HyGen——干扰感知的LLM推理系统,通过精准的批次延迟预测器、SLO感知的性能分析器和前缀共享最大化调度策略,实现在线和离线工作负载的弹性共置,在保证严格SLO合规的同时获得3.87-5.84倍吞吐提升。

MetaMind: Modeling Human Social Thoughts with Metacognitive Multi-Agent Systems

提出 MetaMind——一个受心理学元认知理论启发的多智能体框架,通过 ToM Agent(心理状态假设生成)、Moral Agent(社会规范约束精炼)和 Response Agent(响应生成与自我验证)三阶段协作,显著提升 LLM 的社会推理能力,在多个社会智能基准上达到 SOTA 并首次接近人类水平。

SciArena: An Open Evaluation Platform for Non-Verifiable Scientific Literature-Grounded Tasks

构建 SciArena 社区驱动的科学文献评估开放平台,采用 Chatbot Arena 式的人类偏好投票方式对 47 个基础模型进行排名,收集超过 20,000 条投票数据,并发布 SciArena-Eval 元基准来评测自动评估系统对文献任务答案质量的判断能力。