🤖 机器人/具身智能¶
🤖 AAAI2026 · 共 14 篇
- A Computable Game-Theoretic Framework for Multi-Agent Theory of Mind
-
提出基于 Poisson 认知层次(cognitive hierarchy)的博弈论框架,通过 Gamma-Poisson 共轭贝叶斯更新实现可计算的多智能体 Theory of Mind,在避免 POMDP 不可判定性的同时支持递归式有限理性决策与在线信念修正。
- Adaptive Theory of Mind for LLM-based Multi-Agent Coordination
-
提出自适应心智理论智能体(A-ToM),将ToM阶数对齐建模为在线专家建议问题,通过FTL或Hedge算法实时估计伙伴的ToM阶数并动态调整自身推理深度,在重复矩阵博弈、网格导航和Overcooked等4类任务上实现鲁棒的零样本多智能体协作。
- Affordance-Guided Coarse-to-Fine Exploration for Base Placement in Open-Vocabulary Mobile Manipulation
-
针对开放词汇移动操控中机器人基座选位问题,提出一种零样本框架,通过构建跨模态表征(Affordance RGB + Obstacle Map+)将语义affordance线索投射到障碍物地图上,再用粗到细迭代优化平衡语义和几何约束,在5个操控任务上达到85%成功率,大幅超越几何规划器和纯VLM方法。
- Attention as Binding: A Vector-Symbolic Perspective on Transformer Reasoning
-
本文提出将Transformer自注意力机制重新解释为向量符号架构(VSA)中的软绑定/解绑定算子——Query/Key定义角色空间、Value编码填充项、注意力权重实现可微解绑定、残差连接实现叠加——从而以代数视角统一解释LLM在符号推理中的能力与脆弱性,并提出显式绑定头、超维记忆层等VSA启发的架构改进方向。
- Causal Inference Under Threshold Manipulation: Bayesian Mixture Modeling and Heterogeneous Treatment Effects
-
提出 BMTM/HBMTM 贝叶斯混合模型框架,在消费者策略性操纵消费额以达到奖励阈值的场景下,通过将观测分布拆解为 bunching 与 non-bunching 两个子分布,准确估计阈值因果效应及跨子群的异质性处理效应。
- Characterizing AI Manipulation Risks in Brazilian YouTube Climate Discourse
-
通过心理语言学框架分析巴西 YouTube 上 22.6 万条气候变化视频和 275 万条评论,揭示情感/道德修辞显著驱动用户互动,并展示微调 LLM 可自动生成高互动性的气候否认评论,警示生成式 AI 在舆论操控中的潜在风险。
- Cross Modal Fine-Grained Alignment via Granularity-Aware and Region-Uncertain Modeling
-
提出 GRM 框架,通过模态内显著性/粒度感知适配器和基于高斯混合的区域级不确定性建模,实现鲁棒的细粒度图文对齐,在 Flickr30K 和 MS-COCO 上取得 SOTA。
- EvoEmpirBench: Dynamic Spatial Reasoning with Agent-ExpVer
-
提出 EvoEmpirBench(EEB),包含两个动态交互式 benchmark(局部可观测迷宫导航 + 消消乐),以及 Agent-ExpVer 三智能体在线学习框架(GeoLink 交互 + InsightForce 经验抽象 + TruthWeaver 知识管理),通过"经验→验证→真理归纳"的认知循环实现无参数更新的持续策略进化,使 GPT-4.1 成功率提升 5.6%、Qwen-32B 提升 29%。
- iSeal: Encrypted Fingerprinting for Reliable LLM Ownership Verification
-
提出 iSeal——首个在模型窃取者完全控制推理过程的黑盒场景下仍能可靠验证 LLM 所有权的主动指纹方法,通过外部加密编码器 + RSC 纠错 + 相似度匹配三重机制,在 12 个 LLM、10+ 种攻击下均保持 100% 指纹成功率(FSR),而已有方法降至 0%。
- Neural Graph Navigation for Intelligent Subgraph Matching
-
提出 NeuGN(Neural Graph Navigation)框架,首次将生成式神经导航集成到子图匹配的核心枚举阶段,通过 QSExtractor 提取查询图结构信号 + GGNavigator 将暴力枚举转为结构感知的候选节点优先排序,在保证完备性的同时将 First Match Steps 最高减少 98.2%。
- Robust Out-of-Order Retrieval for Grid-Based Storage at Maximum Capacity
-
针对满载 2D 网格存储系统中检索顺序不确定的问题,提出 k-bounded perturbation 不确定性模型,证明 Θ(k) 列宽是零重定位的充要条件,并给出高效鲁棒存储求解器与贪心检索策略,当 k ≤ 0.5c 时几乎消除重定位,k 到达 c 时仍减少 50%+ 重定位。
- Shadows in the Code: Exploring the Risks and Defenses of LLM-based Multi-Agent Software Development Systems
-
首次系统分析 LLM 多 Agent 软件开发系统(ChatDev/MetaGPT/AgentVerse)的安全风险:提出 IMBIA 攻击框架覆盖两种威胁场景(恶意用户+良性Agent / 良性用户+恶意Agent)和 12 种恶意行为(5 大恶意软件家族),攻击成功率高达 93%(ChatDev),并设计 Adv-IMBIA 对抗性防御将 ASR 降低 40-73%。
- Towards Reinforcement Learning from Neural Feedback: Mapping fNIRS Signals to Agent Performance
-
提出 NEURO-LOOP 框架,利用 fNIRS(功能性近红外光谱)脑信号作为隐式神经反馈评估 RL agent 表现,发布 25 名被试 × 3 领域 × 6 条件的 fNIRS 数据集,分类 F1 达 67%(二分类)/ 46%(多分类),跨被试 fine-tuning 分别提升 17% 和 41%,奠定 Reinforcement Learning from Neural Feedback (RLNF) 基础。
- Unintended Misalignment from Agentic Fine-Tuning: Risks and Mitigation
-
本文揭示了在良性 Agent 数据上微调 LLM 会导致意外的安全对齐偏移(攻击成功率增加 32-38%),并提出 PING(Prefix Injection Guard)——通过迭代生成+评估自然语言前缀来引导微调后的 Agent 拒绝有害请求,平均提升拒绝率 66%(Web)和 44%(代码),同时保持任务性能(仅降 1.8%)。