跳转至

🔗 因果推理

📹 ICCV2025 · 2 篇论文解读

A Visual Leap in CLIP Compositionality Reasoning through Generation of Counterfactual Sets

提出基于LLM+扩散模型的block-based diffusion方法自动生成高质量反事实图文对数据集,配套设计set-aware损失函数,无需人工标注即可显著提升CLIP的组合推理能力,在ARO/VL-Checklist等benchmark上以更少数据超越SOTA。

Social Debiasing for Fair Multi-modal LLMs

本文构建了包含 18 种社会概念的大规模反事实数据集 CMSC,并提出反刻板印象去偏策略 ASD(含偏差感知数据重采样 + Social Fairness Loss),在四种 MLLM 架构上有效降低了社会偏见,同时几乎不损害通用多模态能力。