跳转至

Dialectic-Med: Mitigating Diagnostic Hallucinations via Counterfactual Adversarial Multi-Agent Debate

会议: ACL 2026
arXiv: 2604.11258
代码: 无
领域: 医学NLP
关键词: 医学幻觉, 多智能体辩论, 反事实推理, 视觉证伪, 确认偏差

一句话总结

提出 Dialectic-Med,一个受波普尔证伪主义启发的多智能体医学诊断框架,通过提议者(诊断假设)、反对者(视觉证伪模块主动检索矛盾视觉证据)和调解者(加权共识图决策)的对抗辩证推理,在 MIMIC-CXR-VQA、VQA-RAD 和 PathVQA 上取得 SOTA,解释忠实度提升 12.5%,显著缓解诊断幻觉。

研究背景与动机

领域现状:多模态 LLM 正被整合到医疗高风险领域(放射学报告生成、医学视觉问答),但面临严重的诊断幻觉问题——模型倾向于确认偏差,生成流畅但事实错误的诊断陈述。

现有痛点:(1) LLM 常"锁定"初步文本假设,然后"幻觉"出视觉特征来支持这个可能错误的结论,导致错误级联传播;(2) CoT 推理本质上是线性前向推理,缺乏内在的自我纠正机制——倾向于寻找验证当前步骤的证据而非挑战它("验证主义陷阱");(3) 现有多智能体系统大多依赖静态共识或纯文本辩论,没有视觉证据驱动。

核心矛盾:稳健的诊断不应仅靠找到支持性证据,而应该经受严格的证伪尝试——但现有方法缺乏证伪机制。

本文目标:设计一个显式建模证伪过程的多智能体框架,迫使系统打破确认偏差循环,将推理牢固地建立在经过对抗审查的视觉区域上。

切入角度:从波普尔科学哲学——证伪主义出发,诊断应通过"尝试推翻它但失败了"来建立可信度。

核心 idea:三个角色专职 Agent(提议者诊断+反对者视觉证伪+调解者共识)的对抗辩证循环,关键创新在于反对者的视觉证伪模块——不是语义辩论而是主动检索矛盾视觉证据。

方法详解

整体框架

迭代循环:提议者基于医学图像提出诊断假设 → 反对者生成反事实探针查询(如"如果是肺炎,应该有不透明阴影")→ 视觉证伪模块在图像中定位矛盾证据 → 调解者评估攻击强度 → 如果攻击足够强则提议者修正假设 → 直到共识达成或达到最大轮次。整个过程构建动态共识图。

关键设计

  1. 视觉证伪模块(VFM):

    • 功能:让反对者不仅能语义辩论,还能主动在图像中定位矛盾视觉证据
    • 核心思路:给定假设 \(H_t\)(如"肺炎"),反对者生成反事实探针查询 \(Q_{cf}\)(如"清晰的肺肋角"——这是肺炎不存在的证据)。用 PubMedCLIP 计算探针查询与图像块之间的余弦相似度注意力图 \(M_{cf}\),高注意力区域即为矛盾证据
    • 设计动机:纯文本辩论可能基于参数先验而非视觉证据。VFM 强制将辩论落地到具体的图像区域,使反驳有据可查
  2. 动态共识图:

    • 功能:结构化记录辩证过程并辅助最终决策
    • 核心思路:节点 \(\mathcal{V}_t\) 代表诊断假设或视觉证据,边 \(\mathcal{E}_t\) 编码支持/反驳逻辑关系及置信度权重。攻击强度 \(S_{attack} = \frac{1}{|R_k|}\sum_{r \in R_k} \alpha_r\) 量化视觉证据的可信度。包含环检测防止假设循环
    • 设计动机:不同于简单的多数投票共识,共识图保留了完整的辩证轨迹,支持事后审计和解释
  3. 攻击强度阈值终止:

    • 功能:当反对者找不到足够强的矛盾证据时终止辩论
    • 核心思路:如果 \(S_{attack} < \theta_{thresh}\),说明当前假设经受住了证伪尝试,辩论终止(共识达成)
    • 设计动机:避免无限辩论,同时确保弱攻击不会误导修正

实验关键数据

主实验

方法 MIMIC-CXR-VQA VQA-RAD PathVQA
单 Agent CoT 基线 基线 基线
多 Agent 共识 +中等 +中等 +中等
Dialectic-Med SOTA SOTA SOTA

关键指标提升

指标 提升
解释忠实度 +12.5%
诊断准确率 SOTA
幻觉率 显著降低

关键发现

  • 视觉证伪是关键差异化因素:纯语义辩论的多 Agent 方法改进有限,VFM 带来了本质提升
  • 确认偏差在标准 CoT 中非常严重:模型会"看到"不存在的视觉特征来支持错误假设
  • 3-5 轮辩论通常足以达成共识,计算开销可控
  • 解释忠实度提升 12.5% 表明诊断不仅更准确,而且更可解释、更可信

亮点与洞察

  • 将波普尔证伪主义操作化为 AI 系统设计原则是一个深刻的洞察——不仅找支持证据,更主动寻找反对证据。这个原则可以迁移到任何需要可靠推理的高风险场景
  • VFM 让"辩论"从语言游戏变成了视觉证据驱动的科学过程——反对者不是随意反驳,而是用实际图像区域说话
  • 对医学 AI 安全有直接价值:在部署到临床前,证伪机制可以作为安全保障层

局限与展望

  • VFM 依赖 PubMedCLIP 的视觉-语言对齐质量,在罕见病变上可能退化
  • 多轮辩论增加推理延迟,对实时诊断有约束
  • 反事实探针的质量依赖于医学知识 \(\mathcal{K}_{med}\) 的完整性
  • 仅在 VQA 任务上验证,放射学报告生成等更复杂任务待探索
  • 共识图的构建和遍历增加了系统复杂度

相关工作与启发

  • vs 标准 CoT: CoT 是线性验证性推理,Dialectic-Med 是迭代证伪性推理
  • vs CAMEL 等多 Agent: CAMEL 用角色扮演协作,Dialectic-Med 用对抗辩证——后者更适合需要审查的场景
  • vs Med-PaLM: Med-PaLM 追求单模型准确率,Dialectic-Med 通过系统设计保证可信度

评分

  • 新颖性: ⭐⭐⭐⭐⭐ 证伪主义+视觉证伪模块的结合是全新范式
  • 实验充分度: ⭐⭐⭐⭐ 三个基准+忠实度评估,但消融细节略少
  • 写作质量: ⭐⭐⭐⭐⭐ 哲学动机和技术实现的连接非常自然
  • 价值: ⭐⭐⭐⭐⭐ 对医学 AI 安全和可信推理有深远意义

相关论文