跳转至

🎁 推荐系统

📷 CVPR2025 · 2 篇论文解读

FineVQ: Fine-Grained User Generated Content Video Quality Assessment

构建了首个大规模细粒度 UGC 视频质量评估数据库 FineVD(6104 视频、80 万+评分、6 个维度),并提出基于大型多模态模型的 FineVQ 方法,以一个模型同时实现质量评级、质量评分和质量归因三种能力,在 FineVD 和其他 UGC-VQA 数据集上达到 SOTA。

VisionArena: 230K Real World User-VLM Conversations with Preference Labels

VisionArena 构建了一个包含 230K 条真实用户与 VLM 交互记录的大规模数据集(含偏好标签),涵盖 73K 用户、45 个 VLM、138 种语言,揭示了当前 VLM 在空间推理和规划任务上的不足,并展示了用真实对话数据微调可显著超越 LLaVA-Instruct。