An Epistemic Perspective on Agent Awareness¶
会议: AAAI 2026
arXiv: 2511.05977v1
代码: 无
领域: AI Safety / 形式化验证
关键词: 认知逻辑, agent awareness, de re/de dicto, 2D语义学, 完备性证明
一句话总结¶
本文首次将 agent awareness(智能体感知/意识)视为一种知识形式,区分了 de re(关于物理对象的)和 de dicto(关于概念/描述的)两种感知模态,并基于 2D 语义学提出了一个可靠且完备的逻辑系统来刻画这两种模态与标准"事实知识"模态之间的相互作用。
背景与动机¶
随着人工智能体越来越多地参与影响人类生活的重要决策,正确的决策往往取决于对其他智能体存在的感知(awareness)。例如: - 战争机器人必须在感知到平民存在时最小化伤亡 - 自动驾驶汽车必须在感知到让行标志处有来车时停车 - 医疗AI在感知到有人生病时必须提供帮助 - 价值对齐的机器人在感知到有人被冒犯时必须道歉
然而,"awareness"是一个模糊的术语,现有文献将其视为一个独立概念。剑桥词典将其定义为"knowledge that something exists"(知道某物存在的知识),这暗示了一种认知论(epistemic)解释。本文正是基于这一认知论视角,给出了 awareness 的形式化账户。
核心问题¶
- 如何形式化地区分两种不同形式的 agent awareness?
- 如何建立一个逻辑系统来推理这两种 awareness 及其与标准知识的关系?
- 该逻辑系统是否可靠且完备?
方法详解¶
整体框架¶
论文构建了一个基于自我中心逻辑(egocentric logic)和 2D 语义学的认知逻辑系统,包含三个模态算子:
- K φ("knows φ about herself"):标准的自我知识模态,表示智能体知道关于自身的属性 φ
- R φ("de re aware"):de re 感知模态,表示智能体作为物理对象感知到某个具有属性 φ 的智能体
- D φ("de dicto aware"):de dicto 感知模态,表示智能体在概念层面感知到某个具有属性 φ 的智能体
关键设计¶
1. De Re vs De Dicto 的区分(核心创新)
通过一个运行示例清晰说明:Ann 在新加坡博物馆外看到一辆车(实际是便衣警车),同时收到 WeRide 自动驾驶车已到的短信但看不到车。
- De re awareness(R φ):Ann 看到了警车(作为物理对象),但不知道它是警车。智能体 b 在当前世界具有属性 φ,且 b 存在于所有 a 无法区分的世界中。
- De dicto awareness(D φ):Ann 知道附近有一辆 WeRide(作为概念),但不知道具体是哪辆车。在每个 a 无法区分的世界中,至少存在一个具有属性 φ 的智能体。
2. 认知模型(Epistemic Model)
形式化定义为五元组 (W, A, P, ∼, π):
- W:可能世界集合
- A:智能体集合
- P ⊆ A × W:存在关系(哪个智能体出现在哪个世界)
- ∼ₐ:智能体 a 的不可区分等价关系
- π(p):命题变元的赋值
3. 满足关系的三元定义
采用三元满足关系 w, a ⊩ φ(世界 w、智能体 a、公式 φ),这是 2D 语义学的核心,允许同时捕捉"世界的属性"和"智能体的属性"。
4. 公理系统(8条公理 + 4条推理规则)
公理: 1. Truth:K φ → φ(知道的必为真) 2. Negative Introspection:¬K φ → K ¬K φ(不知道则知道自己不知道) 3. Distributivity:K(φ→ψ) → (Kφ→Kψ) 4. Self-Awareness:φ → R φ 和 Kφ → Dφ(自知) 5. Introspection of Awareness:Dφ → KDφ(de dicto 感知可内省) 6. Unawareness of Falsehood:¬R⊥ 和 ¬D⊥(不可能感知到假命题) 7. Disjunctivity:R(φ∨ψ) → Rφ ∨ Rψ(de re 的析取性) 8. General Awareness:D(Rφ ∨ Dφ) → Dφ(一般感知公理)
推理规则:Modus Ponens、Necessitation(φ ⊢ Kφ)、两条 Monotonicity 规则(针对 D 和 R)。
损失函数 / 训练策略¶
本文是纯理论/形式化验证工作,不涉及损失函数或训练策略。核心技术是完备性证明,使用了改进的 "matrix" 技术:
- Frame 构造:定义了 frame 作为部分构建的模型,包含显式的 awareness 关系 ↝
- λ-assured 集合:引入 λ-assured 的概念处理模型构建中的"幽灵间谍"现象——只有绝对不可检测的智能体才与数据集一致
- 完备 frame:通过逐步扩展有限 frame(添加新世界/新智能体)满足五类完备性要求
- 典范模型:基于完备 frame 构建典范模型,证明 Truth Lemma(φ ∈ X^a_w ⟺ w, a ⊩ φ)
实验关键数据¶
本文为纯理论工作,主要结果为两个定理:
| 定理 | 内容 | 意义 |
|---|---|---|
| Theorem 1(Soundness) | 若 ⊢φ,则对所有认知模型的世界 w 和智能体 a,w,a ⊩ φ | 公理系统不会推出错误结论 |
| Theorem 2(Strong Completeness) | 若 X ⊬ φ,则存在认知模型使 X 中所有公式为真但 φ 为假 | 公理系统足以推出所有语义有效公式 |
消融实验要点¶
作为理论工作,论文通过以下方式验证了各公理的必要性:
- Self-Awareness 公理的合理性来源于模型设计:每个智能体必然存在于其出现的所有世界中
- Introspection of Awareness 仅对 D(de dicto)成立,对 R(de re)一般不成立——这是一个重要的不对称性
- Disjunctivity 仅对 R 成立(由语义的存在量词结构保证),对 D 不成立
- General Awareness 公理连接了 R 和 D,名称源自 A φ = R φ ∨ D φ 的"一般感知"缩写
亮点¶
- 概念创新:首次将 awareness 从独立概念转变为知识的子类型,这一视角在哲学上更优雅且在实际应用中更有操作性
- De re/de dicto 的精确形式化:用无量词的模态逻辑(而非一阶认知逻辑)捕捉了本质上需要量词的概念区分
- 运行示例设计精妙:通过 Ann、WeRide 和警车的场景,将抽象的逻辑概念变得直观
- λ-assured 集合的引入:巧妙处理了 frame 构建中"添加新世界导致 awareness 丢失"的技术困难
- 完备性证明的 matrix 技术创新:在已有技术基础上增加了 awareness 关系和行标签,解决了 2D 语义学中世界与智能体的"解耦"问题
局限性 / 可改进方向¶
- 缺乏计算复杂度分析:论文未讨论模态满足问题或模型检测的复杂度
- 静态逻辑:未考虑动态更新(如信息获取/遗忘导致 awareness 变化的动态逻辑扩展)
- 跨世界身份假设:假设了跨世界身份(transworld identity)的存在,但这在语言哲学中本身是有争议的话题
- 单一智能体视角:虽然模型中有多个智能体,但模态 K、R、D 都是关于"当前智能体"的属性,未直接刻画多智能体交互推理
- 缺乏应用验证:未展示该逻辑系统在实际 AI 系统(如自动驾驶决策)中的应用或 model checking 实现
- 与概率/不确定性的结合:现实中 awareness 往往是渐进式的,而非二值逻辑能完整捕捉
与相关工作的对比¶
| 工作 | 关注点 | 与本文区别 |
|---|---|---|
| Fagin & Halpern (1987) | 概念性 awareness(awareness of concepts) | 本文关注 agent awareness(对其他智能体的感知) |
| Board & Chung (2021, 2022) | 基于对象的 unawareness | 不区分 de re/de dicto |
| Epstein, Naumov & Tao (2023) | De re/de dicto "know who" | 使用量词,无法表达 awareness |
| Epistemic Logic with Assignments (Wang & Seligman 2018) | 通用的带赋值认知逻辑 | 更通用但不针对 awareness |
| Jiang & Naumov (2025) | 数据匿名化中的 de re/de dicto | 关注数据集属性推断,非 awareness |
| Naumov & Tao (2023) | "Telling apart" 模态的完备性 | 无 awareness 模态,本文基于其 matrix 技术但做了重要改进 |
本文的独特贡献在于:(1) 首次提出无量词的 awareness 模态 R 和 D;(2) 在完备性证明中引入 awareness 关系和 λ-assured 条件。
启发与关联¶
- 对 AI Safety 的启示:为自动驾驶等系统的"感知-决策"链提供了形式化验证框架——可以精确定义"系统应该在感知到什么时做什么"
- 与 multi-agent systems 结合:可扩展为多智能体协作/博弈中的 awareness 推理,例如"我知道你知道我在这里"的高阶 awareness
- 与 LLM agent 的关联:当前 LLM-based agent 的 awareness 机制(如 tool use、环境感知)缺乏形式化保证,本文的逻辑框架可为此提供理论基础
- model checking 工具开发:基于该公理系统开发自动验证工具,检验 AI 系统的 awareness 属性是否满足安全规范
评分¶
- 新颖性: ★★★★☆ — 将 awareness 作为知识处理的视角新颖,de re/de dicto 在 awareness 中的形式化是原创贡献
- 理论深度: ★★★★★ — 完整的可靠性和强完备性证明,技术含量高
- 实用性: ★★☆☆☆ — 纯理论工作,距离实际应用尚有距离
- 表达清晰度: ★★★★☆ — 运行示例有效地辅助理解,但证明部分技术性较强
- 综合评分: ★★★★☆